Cómo YipitData usa Databricks Agent Bricks para escalar la inteligencia de datos 20 veces
YipitData, una empresa de inteligencia de datos que presta servicio a inversores institucionales y empresas, procesa millones de registros de transacciones diarias provenientes de datos de tarjetas de crédito, recibos obtenidos mediante web scraping y fuentes de datos alternativos. Para escalar sus flujos de etiquetado de comerciantes y resolución de entidades más allá de lo que las reglas manuales de expresiones regulares podían manejar, YipitData integró Databricks Agent Bricks directamente en sus pipelines de producción. En un solo trimestre, la empresa amplió la cobertura automatizada de empresas de 3.000 a 60.000, un aumento de 20 veces, alcanzando una precisión de etiquetado del 92–95% desde el primer momento.
Herramientas y tecnologías
1Categorías de IA
Desafío
YipitData necesitaba etiquetar y enriquecer millones de registros de transacciones diarias en miles de comerciantes y empresas, pero su enfoque manual basado en expresiones regulares estaba limitado por la capacidad de trabajo de los analistas y tenía dificultades para manejar el matiz y la ambigüedad de las entradas de texto libre a escala.
Solución
YipitData desplegó Databricks Agent Bricks mediante inferencia por lotes accesible con SQL directamente dentro de sus pipelines existentes en Databricks, combinando agentes de extracción de información con IA con Databricks Lakebase para la resolución de entidades, todo gobernado por Unity Catalog para mantener el linaje de datos y el cumplimiento normativo sin mover los datos fuera de la plataforma.
Historia completa
YipitData se sitúa en la intersección de los datos financieros y la inteligencia artificial: convierte miles de millones de registros de transacciones procedentes de datos de tarjetas de crédito, recibos extraídos mediante web scraping y decenas de fuentes de datos alternativos en inteligencia de mercado accionable para inversores institucionales. La propuesta de valor de la empresa depende de etiquetar de forma fiable cada transacción con el comerciante o empresa correcta—es decir, de relacionar registros de proveedores ambiguos y desordenados con negocios reales a una escala que permita mantenerse al ritmo de las actualizaciones de datos diarias. A medida que crecían la base de clientes y los volúmenes de datos, la brecha entre lo posible y lo alcanzable se hacía cada vez más visible.
Accede a 365+ casos de uso de IA, 380+ herramientas y rankings de señales de adopción.