TecnologíaOperaciones

Cómo Aquant usa Pinecone para reducir el tiempo de resolución de servicios un 49%

Aquant es una plataforma de IA agéntica diseñada específicamente para profesionales que dan servicio a equipos industriales y médicos complejos en grandes empresas manufactureras. Cuando la infraestructura de búsqueda vectorial propia de la empresa, construida sobre extensiones de PostgreSQL, empezó a ralentizarse bajo la demanda de producción en tiempo real, Aquant migró a Pinecone como columna vertebral de recuperación de su plataforma de IA. El cambio logró búsqueda semántica con latencia inferior a 100 ms, una precisión de recuperación superior al 98% y ayudó a los clientes de Aquant a reducir el tiempo promedio de resolución un 49%.

Impacto

98%+

Precisión de recuperación

48%

Aumento en el volumen semanal de preguntas

49%

Reducción del tiempo promedio de resolución

19%

Reducción del coste por caso de servicio

62%

Reducción de costes de reposición de piezas

10–20%

Mejora en las tasas de resolución remota

53%

Caída en la tasa de ausencia de respuesta

~43% (24s → 13.7s)

Reducción del tiempo de entrega de respuesta completa

50%

Incorporación y transferencia de conocimiento más rápidas

Desafío

La infraestructura de búsqueda vectorial propia de Aquant sobre extensiones de PostgreSQL ofrecía calidad de recuperación inconsistente y tiempos de respuesta lentos, limitando la capacidad de la plataforma para ofrecer inteligencia de servicio en tiempo real a escala empresarial.

Solución

Aquant reemplazó su búsqueda vectorial interna por Pinecone como columna vertebral de recuperación semántica, habilitando latencia inferior a 100 ms, indexación de decenas de millones de vectores con espacios de nombres específicos por cliente, y filtrado avanzado de metadatos que potencia sus flujos de trabajo de IA agéntica.

Herramientas y tecnologías

Lo que dicen los líderes

Pinecone es una parte crítica de nuestra arquitectura agéntica; impulsa la columna vertebral de recuperación de Aquant AI, incluido nuestro agente de conocimiento, que ofrece orientación contextual en tiempo real a los profesionales de servicio. Su rendimiento y escalabilidad nos permiten atender a nuestros clientes en producción a escala empresarial, sin comprometer la velocidad ni la precisión. Eso nos ha permitido ir más allá de las respuestas estáticas y avanzar hacia una inteligencia de servicio dinámica impulsada por IA.

Oded Sagie, Vicepresidente de Producto e I+D, Aquant
Entiende todo el contexto.

Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.

Historia completa

Aquant opera en la intersección del servicio de campo, la IA y la gestión del conocimiento industrial. Su plataforma sirve a técnicos, agentes de centros de llamadas, responsables de servicio e incluso clientes finales en grandes empresas manufactureras, extrayendo respuestas de vastos repositorios de manuales de servicio, registros de reparaciones, notas de técnicos, esquemas, catálogos de piezas y transcripciones de llamadas. La calidad de esas respuestas depende enteramente de la velocidad y precisión del sistema de recuperación subyacente.

En sus primeras etapas de crecimiento, Aquant construyó su infraestructura de búsqueda vectorial internamente sobre extensiones de PostgreSQL y almacenamiento de blobs. Ese enfoque funcionó para herramientas internas y analítica sin conexión, pero cedió ante las demandas de producción en tiempo real. La búsqueda era lenta, la calidad de recuperación era inconsistente, y mantener la infraestructura desviaba recursos de ingeniería del desarrollo de producto. El equipo evaluó varias alternativas antes de elegir Pinecone por su madurez empresarial, infraestructura gestionada y filtrado avanzado de metadatos construido específicamente para cargas de trabajo RAG.

Pinecone es ahora el ancla de la pila de recuperación agéntica de Aquant. El contenido de todos los tipos de documentos se indexa en Pinecone para búsqueda semántica rápida. La plataforma ofrece latencia inferior a 100 ms, indexa decenas de millones de vectores en espacios de nombres específicos por cliente, y admite filtrado rico de metadatos que adaptó las respuestas por tipo de activo, fuente de documento o categoría de problema. Con la recuperación dejando de ser un cuello de botella, Aquant amplió su uso de agentes inteligentes que aflorar acciones óptimas y generan flujos de trabajo que se adaptan dinámicamente a las condiciones de servicio en tiempo real.

El cambio de rendimiento fue inmediato. El tiempo de inicio de respuesta cayó de más de 5 segundos a 2,89 segundos; la entrega de respuesta completa se redujo de aproximadamente 24 segundos a 13,7 segundos. La tasa de ausencia de respuesta, consultas sin salida válida, cayó un 53%. La precisión de recuperación supera ahora consistentemente el 98% en benchmarks internos. El volumen semanal de preguntas creció un 48%, una señal directa de que los profesionales de servicio confían y utilizan más el sistema.

Para los clientes de Aquant, el impacto es sustancial: el coste por caso de servicio cayó un 19%, los costes de reposición de piezas bajaron un 62%, las tasas de resolución remota mejoraron un 10–20% y el tiempo promedio de resolución se redujo un 49%. Los nuevos empleados alcanzan la competencia plena en la mitad de tiempo. Aquant continúa avanzando, extendiendo la calidad de recuperación a contenidos en alemán, neerlandés y japonés sin pipelines de anotación personalizados.

Casos similares

TX
Terminal X
0.68 to 0.91
f1 retrieval accuracy improvement

Terminal X is a vertical AI platform for institutional investors that acts as a 24/7 research agent, processing millions of financial documents for hedge funds, asset managers, and private equity firms. By rebuilding its retrieval architecture on Pinecone’s vector database, Terminal X improved F1 retrieval accuracy from 0.68 to 0.91, cut average latency by over 35%, and doubled deployment velocity. Users now save approximately three hours per day, and investment memo preparation dropped from two days to half a day.

Financial ServicesTechnologyPPinecone
C
CustomGPT.ai
>400M
vectors stored

CustomGPT.ai built a RAG-as-a-Service platform on Pinecone storing over 400M vectors, achieving sub-20ms query latency and the #1 ranking in an independent RAG accuracy benchmark.

TechnologyPPinecone
D
Delphi
>100M
vectors stored

Delphi is an AI platform that enables coaches, creators, and experts to deploy interactive “Digital Minds”—always-on conversational agents trained on their unique content. Scaling from proof of concept to a commercial platform with thousands of customers required a vector database that could support millions of isolated namespaces, billions of vectors, and sub-second retrieval under variable load. Delphi selected Pinecone, achieving P95 query latency of 100ms and keeping retrieval under 30% of total response time—freeing the engineering team to build product rather than manage infrastructure.

TechnologyPPinecone
1
1up
10x faster
response generation speed for rfps and compliance questionnaires

1up, a sales knowledge automation platform, integrated Pinecone's vector database to power a RAG-based system that delivers real-time, highly accurate answers to complex sales queries. The solution replaced a slow, home-grown embedding system and achieved 10x faster response generation for RFPs and compliance questionnaires. Sales reps can now handle high volumes of queries with confidence, reducing reliance on colleagues and accelerating the go-to-market process.

TechnologyAAWSPPinecone
A
Assembled
~95%
ticket handling time reduction

Assembled is a workforce management and customer support optimization platform serving enterprises like Stripe, Etsy, and DoorDash. To power Assembled Assist, the company built a hybrid RAG pipeline combining Pinecone vector search with Algolia keyword retrieval and LLMs from OpenAI and Anthropic. Support tasks that previously took 40 minutes now complete in 2 minutes—a 95% reduction in handling time.

TechnologyAAlgoliaOLOpenAI LLMs
G
Gong
10x
infrastructure cost reduction

Gong is a revenue intelligence platform that analyzes billions of customer interactions to help sales teams improve performance. To power Smart Trackers—its patented AI system for detecting and classifying concepts in sales conversations—Gong adopted Pinecone as its core vector database, storing billions of sentence-level embeddings across real conversations. Migrating to Pinecone Serverless delivered a 10x reduction in infrastructure costs while sustaining peak search performance across a massive corpus.

TechnologyPPinecone
A
Allspice
20% → 97%
ingredient matching accuracy

Allspice, a food technology startup building a kitchen operating system for consumers and recipe publishers, deployed Pinecone’s vector database to solve the inherent messiness of ingredient data that traditional text search could not handle. The implementation raised ingredient matching accuracy from roughly 20% to 97%, enabling the launch of recipe importing as a core product feature and expanding into a platform-wide semantic layer for search, recommendations, and conversational AI.

TechnologyTtext-embedding-3-largePPinecone
Z
ZoomInfo
>50%
increase in user engagement

ZoomInfo, a B2B go-to-market intelligence platform with hundreds of millions of professional contact records, needed a vector database to power real-time personalized contact recommendations for sales and marketing teams. The company deployed Pinecone’s serverless vector database with Dedicated Read Nodes to run semantic search over 390 million contact embeddings with sub-second latency. The result was a 50% increase in user engagement, a 2x improvement in recommendation relevancy, and 50x more peak request capacity.

TechnologyPPinecone