Cómo Contextual AI usa Elasticsearch para lograr más del 90% de precisión en RAG a escala
Contextual AI es una empresa de plataforma de IA empresarial especializada en sistemas de Generación Aumentada por Recuperación (RAG) listos para producción en tareas de conocimiento complejas. La empresa construyó su plataforma de ingeniería de contexto sobre Elasticsearch, utilizando búsqueda híbrida que combina BM25 y búsqueda vectorial para potenciar agentes de IA precisos y escalables para clientes empresariales. Con esta base, los agentes de Contextual AI alcanzan más del 90% de precisión en tareas de producción exigentes, muy por encima del rango del 65–75% típico de los enfoques RAG tradicionales.
Impacto
90%+
Precisión RAG alcanzada en producción
22 million chunks
Mayor repositorio de datos indexado
60,000+
Documentos en el repositorio más grande
Desafío
Los despliegues de IA empresarial construidos sobre componentes RAG de código abierto fragmentados suelen estancarse en un 65–75% de precisión, lo cual es inadecuado para casos de uso en producción relacionados con cumplimiento, gestión del conocimiento o soporte al cliente donde los errores tienen un costo real para el negocio. Gestionar sistemas de búsqueda vectorial y por palabras clave por separado añadía carga de ingeniería y dificultaba mantener la coherencia entre los entornos de investigación y producción.
Solución
Contextual AI construyó su plataforma de ingeniería de contexto sobre Elasticsearch, utilizando la capacidad de búsqueda híbrida nativa de Elastic para ejecutar consultas de palabras clave BM25 y similitud vectorial a través de una sola API. Este enfoque unificado permitió al equipo manejar repositorios de hasta 22 millones de fragmentos, alinear los entornos de investigación y producción, y soportar despliegues multinube y locales para clientes empresariales.
Herramientas y tecnologías
Lo que dicen los líderes
“El soporte integral de Elastic para BM25, combinado con sus capacidades de búsqueda vectorial dentro de la misma base de datos, nos permite realizar ambos tipos de búsquedas simultáneamente sin la complejidad de gestionar servicios separados.”
“Una ventaja significativa para nosotros es que nuestro equipo de plataforma también utiliza Elasticsearch como solución de despliegue. Esto garantiza la alineación entre los entornos de investigación y plataforma.”
“En última instancia, la versatilidad de Elasticsearch es un activo significativo. Nos proporciona flexibilidad comercial y la agilidad para adaptarnos rápidamente a nuevos requisitos de despliegue de nuestros clientes.”
Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.
Historia completa
Contextual AI fue fundada para resolver uno de los problemas más persistentes de la IA empresarial: lograr que los modelos de lenguaje de gran tamaño respondan de manera confiable preguntas usando datos propietarios de las empresas. La plataforma de ingeniería de contexto de la compañía se sitúa entre los datos empresariales en bruto y los LLM, proporcionando la recuperación, el reordenamiento y la generación fundamentada necesarios para que los agentes de IA sean lo suficientemente precisos para casos de uso de alto valor en producción. Los clientes despliegan estos agentes para tareas como búsqueda de conocimiento empresarial, análisis de cumplimiento y riesgo, y soporte al cliente, flujos de trabajo donde una precisión del 70% simplemente no es aceptable.
Antes de adoptar Elasticsearch como núcleo de su infraestructura de datos, la mayoría de los despliegues RAG combinaban herramientas de código abierto para gestionar la búsqueda por palabras clave y semántica por separado. Esta fragmentación generaba complejidad de ingeniería, dificultaba el escalado y dejaba la precisión estancada en un rango del 65–75%, incluso después del ajuste fino. Para Contextual AI, construir una plataforma en la que los clientes empresariales pudieran confiar en producción requirió una base diferente, una que pudiera manejar colecciones masivas de documentos multimodales y soportar ambos paradigmas de búsqueda en un solo sistema.
Contextual AI construyó su plataforma sobre Elasticsearch, aprovechando dos capacidades clave. Primero, el soporte de Elastic para búsqueda por palabras clave BM25 y búsqueda por similitud vectorial dentro de la misma base de datos eliminó la necesidad de gestionar servicios separados. La API de búsqueda múltiple permite a la plataforma ejecutar consultas híbridas en una sola llamada, optimizando los flujos de trabajo de ingeniería y reduciendo la latencia. Segundo, la base de datos vectorial de Elastic maneja los repositorios de datos más exigentes de la compañía: su índice individual más grande contiene aproximadamente 14 millones de fragmentos provenientes de más de 60.000 documentos, en su mayoría no estructurados y multimodales: PDFs, archivos HTML y documentos con imágenes, tablas, esquemas y diagramas incrustados. El equipo de investigación también utiliza Elasticsearch para evaluar modelos de embeddings en condiciones reales antes de promoverlos a producción.
El resultado es un umbral de precisión que los competidores no pueden igualar. Los agentes de Contextual AI alcanzan consistentemente más del 90% de precisión en tareas de conocimiento complejas, frente al 65–75% típico del RAG convencional. Una de las ventajas más significativas proviene de la alineación entre investigación y producción: como tanto los equipos de investigación como los de plataforma utilizan Elasticsearch, las técnicas probadas en pruebas se trasladan directamente a los sistemas desplegados sin riesgo de integración. Esta consistencia acelera la iteración y da a los clientes empresariales la confianza de que lo que vieron en la evaluación es lo que obtienen en producción.
El modelo de despliegue de Contextual AI abarca Google Cloud como entorno principal, con capacidad para extenderse a regiones de AWS y Azure, o a entornos locales y de VPC controlados por el cliente para aquellos con requisitos estrictos de cumplimiento de datos. Esta flexibilidad, respaldada por el soporte multinube y las capacidades de alojamiento propio de Elasticsearch, se ha convertido en un diferenciador comercial a medida que más empresas imponen requisitos de soberanía de datos a los proveedores de IA. La compañía considera su arquitectura basada en Elastic como fundacional para escalar hacia despliegues empresariales cada vez más complejos.