Cómo Ensono Usa Snowflake ML para Predecir Fallos de TI y Reducir el MTTR hasta un 70%
Ensono, un proveedor de servicios gestionados que procesa más de 60.000 millones de transacciones minoristas y plataformas gubernamentales para 24 millones de ciudadanos, construyó dos sistemas impulsados por IA en Snowflake para transformar las operaciones de TI de reactivas a predictivas. El motor de predicción Envision (EPE) y la aplicación DiagnoseNow redujeron el tiempo medio de resolución entre un 54 y un 70%, redujeron los incidentes graves en un 22% y mejoraron el rendimiento de los SLA en un 38% en toda su base de clientes empresariales.
Impacto
54–70%
Reducción en el tiempo medio de resolución (MTTR)
22%
Reducción de incidentes graves
38%
Mejora en el rendimiento de los SLA
< 2 minutes
Tiempo para generar análisis de incidentes con IA
75M+ events, 9M+ alerts
Eventos analizados por EPE
Desafío
Los ingenieros de Ensono gestionaban entornos de TI para grandes clientes empresariales que generaban millones de alertas sin una forma fiable de predecir cuáles escalarían a incidentes graves, mientras que el análisis manual de causas raíz ralentizaba la resolución de incidentes.
Solución
Ensono construyó el Motor Predictivo Envision y DiagnoseNow en la Nube de Datos AI de Snowflake, usando Snowflake ML para el entrenamiento y despliegue de modelos, Cortex AI para el etiquetado de datos y el análisis automatizado de causas raíz, y Streamlit en Snowflake para la interfaz de resolución de incidentes integrada con ServiceNow.
Herramientas y tecnologías
Lo que dicen los líderes
“Cuando EPE propone incidentes graves, el MTTR es un 54% inferior.”
“Hemos alcanzado nuevas cotas en satisfacción del cliente. El ochenta por ciento de nuestros clientes nos recomienda a otros clientes. Es una medida tangible de la calidad de la entrega que proporcionamos a cada uno de nuestros clientes.”
“Reconocimos desde el principio que Snowflake tenía un valor único para nuestro negocio. En parte porque alberga mucho de nuestros datos, pero también por sus amplias capacidades para construir, alojar y ejecutar inferencias con modelos de aprendizaje automático.”
“Queríamos desplegar modelos lo más rápido posible. Y con Snowflake ML, no tenemos que preocuparnos por crear o encontrar otra plataforma de alojamiento de modelos porque podemos usar el Registro de Modelos para gestionarlos y desplegarlos para inferencia con nuestros flujos de trabajo existentes.”
Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.
Historia completa
Ensono opera como proveedor de servicios gestionados para grandes clientes empresariales cuyos entornos de TI abarcan cientos de servidores, miles de cuentas SaaS y terabytes de datos operativos. La empresa da soporte a infraestructura crítica a escala, procesando más de 60.000 millones de transacciones minoristas y proporcionando a 24 millones de ciudadanos acceso a plataformas gubernamentales. A esa escala, un ticket mal clasificado o una respuesta a incidentes tardada no afecta solo a un cliente: se propaga a través de docenas de entornos complejos donde el tiempo de inactividad tiene consecuencias financieras y operativas directas.
El modelo tradicional de proveedor de servicios gestionados de monitorizar-alertar-responder era estructuralmente inadecuado. Los ingenieros recibían avalanchas de alertas sin un mecanismo fiable para identificar cuáles eran verdaderos precursores de incidentes graves y cuáles eran ruido. El etiquetado de datos para el entrenamiento de modelos era un proceso manual e intensivo en paneles que resultaba difícil de escalar. Jim Piazza, Director de IA de Ensono, estableció un objetivo específico: cambiar el modelo operativo a prevenir-predecir-optimizar.
Ensono construyó dos sistemas usando la Nube de Datos AI de Snowflake. El primero, el Motor Predictivo Envision (EPE), es un modelo de ML que ingiere datos de millones de eventos y alertas en los entornos de los clientes, estima la probabilidad de que cada ticket de soporte se convierta en un evento que afecte al servicio, y destaca los tickets de alta prioridad como notificaciones emergentes en ServiceNow para los ingenieros de primera línea. Los modelos GPT accedidos a través de Snowflake Cortex AI automatizaron el proceso históricamente manual de etiquetado de datos. El segundo sistema, DiagnoseNow, construido con Streamlit en Snowflake y Cortex AI, automatiza el análisis de causa raíz proporcionando detalles específicos del caso, cronologías de eventos, resúmenes de errores y acciones recomendadas en menos de dos minutos.
Los resultados son concretos. Cuando EPE detecta un incidente grave, el MTTR es un 54% inferior al de referencia. En algunos casos, las pruebas piloto de DiagnoseNow mostraron reducciones de MTTR de hasta el 70%. Combinados, los dos sistemas han ayudado a Ensono a detectar más de 1.700 problemas y reducir los incidentes graves en un 22%. El rendimiento de los SLA mejoró un 38%, y el 80% de los clientes recomienda activamente Ensono a otras organizaciones.
Ensono continúa expandiendo la capa de IA. El equipo está adoptando Snowpark Container Services para acelerar los tiempos de respuesta de DiagnoseNow, y los servidores de Model Context Protocol (MCP) gestionados por Snowflake están previstos para la próxima fase del motor de decisiones.