Cómo Grammarly procesa 5.000 millones de eventos diarios en 15 minutos con Databricks
Grammarly es una plataforma de asistencia de escritura impulsada por IA utilizada por 30 millones de personas y 50.000 equipos en todo el mundo. La empresa migró de un sistema de análisis heredado desarrollado internamente a la Plataforma de Inteligencia de Datos de Databricks para eliminar los silos de datos, unificar su infraestructura de análisis y reducir costos drásticamente. El resultado fue una consulta un 110% más rápida al 10% del costo de ingesta anterior, con 5.000 millones de eventos diarios ahora disponibles para análisis en menos de 15 minutos en lugar de cuatro horas.
Herramientas y tecnologías
1Categorías de IA
Desafío
La plataforma de análisis desarrollada internamente por Grammarly requería un lenguaje tipo SQL personalizado, no podía integrar fuentes de datos externas ni soportar paneles de Tableau, ejecutaba clústeres EMR las 24 horas con altos costos, y creó silos de datos cuando cada equipo resolvió sus necesidades de análisis de forma independiente.
Solución
Grammarly migró al lakehouse de Databricks con Delta Lake como capa de almacenamiento, Databricks SQL para consultas e integración con Tableau, y Unity Catalog para control de acceso detallado y linaje de datos, consolidando todos los datos analíticos en una única fuente de verdad manteniendo la propiedad completa de los datos internamente.
Historia completa
La misión de Grammarly es mejorar vidas mejorando la comunicación, y su plataforma de asistencia de escritura ahora sirve a 30 millones de personas y 50.000 equipos en todo el mundo. Cada sugerencia aceptada, rechazada o ignorada genera un evento, sumando aproximadamente 5.000 millones de eventos por día. Gestionar y analizar esos datos a escala se convirtió en el desafío de infraestructura definitorio de la empresa.
Accede a 375+ casos de uso de IA, 384+ herramientas y rankings de señales de adopción.