TecnologíaIngeniería de Software

Cómo Contextual AI usa Elasticsearch para lograr más del 90% de precisión en RAG a escala

Contextual AI es una empresa de plataforma de IA empresarial especializada en sistemas de Generación Aumentada por Recuperación (RAG) listos para producción en tareas de conocimiento complejas. La empresa construyó su plataforma de ingeniería de contexto sobre Elasticsearch, utilizando búsqueda híbrida que combina BM25 y búsqueda vectorial para potenciar agentes de IA precisos y escalables para clientes empresariales. Con esta base, los agentes de Contextual AI alcanzan más del 90% de precisión en tareas de producción exigentes, muy por encima del rango del 65–75% típico de los enfoques RAG tradicionales.

Impacto

90%+

Precisión RAG alcanzada en producción

22 million chunks

Mayor repositorio de datos indexado

60,000+

Documentos en el repositorio más grande

Desafío

Los despliegues de IA empresarial construidos sobre componentes RAG de código abierto fragmentados suelen estancarse en un 65–75% de precisión, lo cual es inadecuado para casos de uso en producción relacionados con cumplimiento, gestión del conocimiento o soporte al cliente donde los errores tienen un costo real para el negocio. Gestionar sistemas de búsqueda vectorial y por palabras clave por separado añadía carga de ingeniería y dificultaba mantener la coherencia entre los entornos de investigación y producción.

Solución

Contextual AI construyó su plataforma de ingeniería de contexto sobre Elasticsearch, utilizando la capacidad de búsqueda híbrida nativa de Elastic para ejecutar consultas de palabras clave BM25 y similitud vectorial a través de una sola API. Este enfoque unificado permitió al equipo manejar repositorios de hasta 22 millones de fragmentos, alinear los entornos de investigación y producción, y soportar despliegues multinube y locales para clientes empresariales.

Herramientas y tecnologías

Lo que dicen los líderes

El soporte integral de Elastic para BM25, combinado con sus capacidades de búsqueda vectorial dentro de la misma base de datos, nos permite realizar ambos tipos de búsquedas simultáneamente sin la complejidad de gestionar servicios separados.

Junaid Saiyed, Director de Ingeniería, Producto y Diseño, Contextual AI

Una ventaja significativa para nosotros es que nuestro equipo de plataforma también utiliza Elasticsearch como solución de despliegue. Esto garantiza la alineación entre los entornos de investigación y plataforma.

Gurnoor Singh Khurana, Miembro del Personal Técnico, Contextual AI

En última instancia, la versatilidad de Elasticsearch es un activo significativo. Nos proporciona flexibilidad comercial y la agilidad para adaptarnos rápidamente a nuevos requisitos de despliegue de nuestros clientes.

Junaid Saiyed, Director de Ingeniería, Producto y Diseño, Contextual AI
Entiende todo el contexto.

Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.

Historia completa

Contextual AI fue fundada para resolver uno de los problemas más persistentes de la IA empresarial: lograr que los modelos de lenguaje de gran tamaño respondan de manera confiable preguntas usando datos propietarios de las empresas. La plataforma de ingeniería de contexto de la compañía se sitúa entre los datos empresariales en bruto y los LLM, proporcionando la recuperación, el reordenamiento y la generación fundamentada necesarios para que los agentes de IA sean lo suficientemente precisos para casos de uso de alto valor en producción. Los clientes despliegan estos agentes para tareas como búsqueda de conocimiento empresarial, análisis de cumplimiento y riesgo, y soporte al cliente, flujos de trabajo donde una precisión del 70% simplemente no es aceptable.

Antes de adoptar Elasticsearch como núcleo de su infraestructura de datos, la mayoría de los despliegues RAG combinaban herramientas de código abierto para gestionar la búsqueda por palabras clave y semántica por separado. Esta fragmentación generaba complejidad de ingeniería, dificultaba el escalado y dejaba la precisión estancada en un rango del 65–75%, incluso después del ajuste fino. Para Contextual AI, construir una plataforma en la que los clientes empresariales pudieran confiar en producción requirió una base diferente, una que pudiera manejar colecciones masivas de documentos multimodales y soportar ambos paradigmas de búsqueda en un solo sistema.

Contextual AI construyó su plataforma sobre Elasticsearch, aprovechando dos capacidades clave. Primero, el soporte de Elastic para búsqueda por palabras clave BM25 y búsqueda por similitud vectorial dentro de la misma base de datos eliminó la necesidad de gestionar servicios separados. La API de búsqueda múltiple permite a la plataforma ejecutar consultas híbridas en una sola llamada, optimizando los flujos de trabajo de ingeniería y reduciendo la latencia. Segundo, la base de datos vectorial de Elastic maneja los repositorios de datos más exigentes de la compañía: su índice individual más grande contiene aproximadamente 14 millones de fragmentos provenientes de más de 60.000 documentos, en su mayoría no estructurados y multimodales: PDFs, archivos HTML y documentos con imágenes, tablas, esquemas y diagramas incrustados. El equipo de investigación también utiliza Elasticsearch para evaluar modelos de embeddings en condiciones reales antes de promoverlos a producción.

El resultado es un umbral de precisión que los competidores no pueden igualar. Los agentes de Contextual AI alcanzan consistentemente más del 90% de precisión en tareas de conocimiento complejas, frente al 65–75% típico del RAG convencional. Una de las ventajas más significativas proviene de la alineación entre investigación y producción: como tanto los equipos de investigación como los de plataforma utilizan Elasticsearch, las técnicas probadas en pruebas se trasladan directamente a los sistemas desplegados sin riesgo de integración. Esta consistencia acelera la iteración y da a los clientes empresariales la confianza de que lo que vieron en la evaluación es lo que obtienen en producción.

El modelo de despliegue de Contextual AI abarca Google Cloud como entorno principal, con capacidad para extenderse a regiones de AWS y Azure, o a entornos locales y de VPC controlados por el cliente para aquellos con requisitos estrictos de cumplimiento de datos. Esta flexibilidad, respaldada por el soporte multinube y las capacidades de alojamiento propio de Elasticsearch, se ha convertido en un diferenciador comercial a medida que más empresas imponen requisitos de soberanía de datos a los proveedores de IA. La compañía considera su arquitectura basada en Elastic como fundacional para escalar hacia despliegues empresariales cada vez más complejos.

Casos similares

L
Lusha
300%
increase in outbound leads

Lusha is a B2B sales intelligence platform with 1.5 million users and a database of over 200 million business contacts. By deploying Elasticsearch as both a full-text search engine and a vector database for AI-powered lead recommendations, Lusha helps customers generate 300% more leads, achieve conversion rates up to 10x higher, and realize return on investment of up to 1,000%.

TechnologyEElasticsearch
A
Apna
20%
increase in employers paying for premium access

Apna, India’s largest jobs and professional networking platform with 50 million registered users and 600,000 employers, built its candidate search and AI job matching infrastructure on Elasticsearch running on Elastic Cloud on Google Cloud. Semantic search capabilities allow employers to find candidates by intent—not just keywords—while AI algorithms analyze candidate profiles to surface the most relevant matches. The result: a 20% increase in employers paying for premium access, 20% higher platform team productivity, and a 50% improvement in employee productivity.

TechnologyEElasticsearch
WE
WP Engine
~5 milliseconds
search query response time

WP Engine, the leading WordPress hosting platform serving more than 1.5 million users across 200,000 websites in 150+ countries, deployed Elastic’s Search AI Platform alongside Google Cloud Vertex AI and Gemini to build Smart Search AI and enable retrieval-augmented generation (RAG) capabilities for its customers. The integration allows WP Engine to deliver natural language search, context-aware product recommendations, and AI-powered chatbots to website owners without requiring them to stitch together multiple vendors. Response times dropped to as low as five milliseconds, and the platform handled traffic spikes from hundreds of thousands to tens of millions of queries per minute with zero downtime.

TechnologyEElasticsearchGVGoogle Vertex AI
P
Pfizer
93%
database reduction

Pfizer achieved a 93% database reduction and 20% cost avoidance by migrating their global SAP environment to S/4HANA on IBM Power10 infrastructure.

PharmaceuticalsTechnologyICIBM ConsultingIPIBM Power Virtual Server
J
Jamf
Under 45 minutes
performance review skill build time

Jamf deployed Claude Enterprise across 16 departments, then built interactive workflow skills using Claude Cowork that transformed manual spreadsheet-based processes into guided, conversational experiences. Performance reviews that previously required months of effort are now built in under 45 minutes, and non-engineering teams independently create custom data dashboards.

TechnologyCEClaude EnterpriseCCClaude Cowork
C
Confluent
15,000+
hours saved monthly

Confluent, a data streaming platform company with 2,000+ employees and 4,000+ customers, deployed Glean to solve the knowledge fragmentation that came with rapid growth from 250 to 2,000+ employees across 20+ systems. Glean indexed the company's full tool stack — Slack, Salesforce, Confluence, and more — enabling instant knowledge retrieval across all teams. The result: 15,000+ hours saved monthly, a 13% increase in support team satisfaction, and over 70% employee adoption.

TechnologyGGlean
C
Classmethod
up to 90%
reduction in development time

Classmethod, a leading Japanese cloud integrator, deployed Claude Code across its engineering teams to address chronic developer shortages. The tool automated code generation, review, and testing workflows, reducing development time by up to 90% on specific tasks and cutting code review time by 80%.

TechnologyCCClaude Code
A
Aquant
98%+
retrieval accuracy

Aquant is an agentic AI platform purpose-built for professionals servicing complex industrial and medical equipment at large manufacturing companies. When the company’s homegrown vector search infrastructure—built on PostgreSQL extensions—began to slow under real-time production demands, Aquant migrated to Pinecone as the retrieval backbone for its AI platform. The switch delivered sub-100ms semantic search, pushed retrieval accuracy above 98%, and helped Aquant’s customers cut average service resolution time by 49%.

TechnologyPPinecone