Cómo ArisGlobal mejoró la fiabilidad de sus aplicaciones de ciencias de la vida con Datadog
ArisGlobal, empresa de software de ciencias de la vida de primera línea en IA que sirve a organizaciones farmacéuticas globales, desplegó APM de Datadog, App Builder, Workflow Automation y On-Call para mejorar la observabilidad y automatizar las operaciones de su plataforma LifeSphere. La remediación automatizada de incidencias redujo la recolección de archivos de diagnóstico de 45–60 minutos a casi instantánea, y el equipo logró el 100% de automatización de tareas operativas previamente manuales.
Impacto
Tiempo de recolección de archivos de diagnóstico reducido de 45–60 minutos a casi instantáneo
100% de automatización de tareas operativas previamente manuales
Eliminación de los costes de licencias de la plataforma de automatización independiente
Desafío
El equipo SRE de ArisGlobal necesitaba capacidades mejoradas de observabilidad y automatización para monitorear y automatizar las operaciones de su plataforma LifeSphere de ciencias de la vida ante el crecimiento de la demanda, pero sus herramientas existentes carecían de las capacidades granulares de APM y automatización integrada necesarias para cumplir los SLOs de forma eficaz.
Solución
ArisGlobal desplegó Datadog APM para rastreo del rendimiento a nivel de usuario, Workflow Automation para remediación de incidencias basada en runbooks, App Builder para interfaces operativas de autoservicio, On-Call para alertas de incidencias y Datastore para la persistencia de estados de servicios y dashboards de SLOs.
Herramientas y tecnologías
Lo que dicen los líderes
“La disponibilidad y el rendimiento de nuestros productos son clave para el éxito de nuestros clientes. Con Datadog, hacemos seguimiento de las métricas de observabilidad y entendemos el impacto en el cliente.”
“Poder crear un botón que remedie un problema que ves en un dashboard y colocarlo justo al lado del widget problemático ha reducido significativamente nuestro tiempo de remediación.”
Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.
Historia completa
ArisGlobal construye LifeSphere —una plataforma interoperable para Safety, Regulatory, Quality y Medical Affairs— para ayudar a empresas farmacéuticas y de biotecnología a gestionar la farmacovigilancia y el cumplimiento regulatorio. El equipo de Ingeniería de Fiabilidad del Sitio (SRE) de la empresa, un grupo pequeño pero crítico, tiene como misión principal garantizar la disponibilidad y cumplir los Objetivos de Nivel de Servicio (SLOs) de LifeSphere. A medida que creció la demanda de la plataforma, el equipo reconoció que su herramienta de observabilidad existente carecía de las capacidades necesarias para dimensionar correctamente los entornos y mantener altos estándares de disponibilidad.
ArisGlobal seleccionó Datadog para abordar sus retos de observabilidad y operaciones. Mediante etiquetado codespan, los ingenieros usan APM para diagnosticar y resolver problemas de rendimiento a nivel de usuario individual, proporcionando visibilidad granular del comportamiento de las aplicaciones en los entornos de infraestructura clave. «Poder ver el tiempo empleado en cada solicitud y trasladar esa información al equipo de desarrollo ha sido invaluable», señala Rajkamal Madhaiyan, Site Reliability Engineer en ArisGlobal.
ArisGlobal también implementó el conjunto de Automatización de Datadog —Workflow Automation, App Builder y Datastore— para optimizar las operaciones y simplificar la remediación. Cuando se producen incidencias, el equipo recibe notificaciones a través de Datadog On-Call y el evento queda registrado automáticamente en Incident Management. Los botones de Workflow Automation integrados directamente en los dashboards permiten a los SREs reiniciar o remediar servicios durante una incidencia, ejecutando runbooks estandarizados sin cambiar de herramienta. App Builder crea interfaces de autoservicio para operaciones de despliegue con controles de acceso estrictos. Datastore mantiene los estados de los servicios para reinicios limpios y alimenta los dashboards de reporte de SLOs.
El cambio a Datadog también generó un ahorro de costes significativo. Anteriormente, ArisGlobal invirtió en una plataforma de automatización independiente que tardó casi un año en configurarse y tuvo problemas de adopción. Al consolidar la automatización dentro de Datadog, el equipo eliminó los costes de licencias independientes y mejoró drásticamente el uso. Los resultados son medibles: la recolección de archivos de diagnóstico que antes tardaba 45–60 minutos ahora ocurre casi al instante, y el 100% de las tareas operativas manuales anteriores están ahora automatizadas.