Cómo Aquant usa Pinecone para reducir el tiempo de resolución de servicios un 49%
Aquant es una plataforma de IA agéntica diseñada específicamente para profesionales que dan servicio a equipos industriales y médicos complejos en grandes empresas manufactureras. Cuando la infraestructura de búsqueda vectorial propia de la empresa, construida sobre extensiones de PostgreSQL, empezó a ralentizarse bajo la demanda de producción en tiempo real, Aquant migró a Pinecone como columna vertebral de recuperación de su plataforma de IA. El cambio logró búsqueda semántica con latencia inferior a 100 ms, una precisión de recuperación superior al 98% y ayudó a los clientes de Aquant a reducir el tiempo promedio de resolución un 49%.
Impacto
98%+
Precisión de recuperación
48%
Aumento en el volumen semanal de preguntas
49%
Reducción del tiempo promedio de resolución
19%
Reducción del coste por caso de servicio
62%
Reducción de costes de reposición de piezas
10–20%
Mejora en las tasas de resolución remota
53%
Caída en la tasa de ausencia de respuesta
~43% (24s → 13.7s)
Reducción del tiempo de entrega de respuesta completa
50%
Incorporación y transferencia de conocimiento más rápidas
Desafío
La infraestructura de búsqueda vectorial propia de Aquant sobre extensiones de PostgreSQL ofrecía calidad de recuperación inconsistente y tiempos de respuesta lentos, limitando la capacidad de la plataforma para ofrecer inteligencia de servicio en tiempo real a escala empresarial.
Solución
Aquant reemplazó su búsqueda vectorial interna por Pinecone como columna vertebral de recuperación semántica, habilitando latencia inferior a 100 ms, indexación de decenas de millones de vectores con espacios de nombres específicos por cliente, y filtrado avanzado de metadatos que potencia sus flujos de trabajo de IA agéntica.
Herramientas y tecnologías
Lo que dicen los líderes
“Pinecone es una parte crítica de nuestra arquitectura agéntica; impulsa la columna vertebral de recuperación de Aquant AI, incluido nuestro agente de conocimiento, que ofrece orientación contextual en tiempo real a los profesionales de servicio. Su rendimiento y escalabilidad nos permiten atender a nuestros clientes en producción a escala empresarial, sin comprometer la velocidad ni la precisión. Eso nos ha permitido ir más allá de las respuestas estáticas y avanzar hacia una inteligencia de servicio dinámica impulsada por IA.”
Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.
Historia completa
Aquant opera en la intersección del servicio de campo, la IA y la gestión del conocimiento industrial. Su plataforma sirve a técnicos, agentes de centros de llamadas, responsables de servicio e incluso clientes finales en grandes empresas manufactureras, extrayendo respuestas de vastos repositorios de manuales de servicio, registros de reparaciones, notas de técnicos, esquemas, catálogos de piezas y transcripciones de llamadas. La calidad de esas respuestas depende enteramente de la velocidad y precisión del sistema de recuperación subyacente.
En sus primeras etapas de crecimiento, Aquant construyó su infraestructura de búsqueda vectorial internamente sobre extensiones de PostgreSQL y almacenamiento de blobs. Ese enfoque funcionó para herramientas internas y analítica sin conexión, pero cedió ante las demandas de producción en tiempo real. La búsqueda era lenta, la calidad de recuperación era inconsistente, y mantener la infraestructura desviaba recursos de ingeniería del desarrollo de producto. El equipo evaluó varias alternativas antes de elegir Pinecone por su madurez empresarial, infraestructura gestionada y filtrado avanzado de metadatos construido específicamente para cargas de trabajo RAG.
Pinecone es ahora el ancla de la pila de recuperación agéntica de Aquant. El contenido de todos los tipos de documentos se indexa en Pinecone para búsqueda semántica rápida. La plataforma ofrece latencia inferior a 100 ms, indexa decenas de millones de vectores en espacios de nombres específicos por cliente, y admite filtrado rico de metadatos que adaptó las respuestas por tipo de activo, fuente de documento o categoría de problema. Con la recuperación dejando de ser un cuello de botella, Aquant amplió su uso de agentes inteligentes que aflorar acciones óptimas y generan flujos de trabajo que se adaptan dinámicamente a las condiciones de servicio en tiempo real.
El cambio de rendimiento fue inmediato. El tiempo de inicio de respuesta cayó de más de 5 segundos a 2,89 segundos; la entrega de respuesta completa se redujo de aproximadamente 24 segundos a 13,7 segundos. La tasa de ausencia de respuesta, consultas sin salida válida, cayó un 53%. La precisión de recuperación supera ahora consistentemente el 98% en benchmarks internos. El volumen semanal de preguntas creció un 48%, una señal directa de que los profesionales de servicio confían y utilizan más el sistema.
Para los clientes de Aquant, el impacto es sustancial: el coste por caso de servicio cayó un 19%, los costes de reposición de piezas bajaron un 62%, las tasas de resolución remota mejoraron un 10–20% y el tiempo promedio de resolución se redujo un 49%. Los nuevos empleados alcanzan la competencia plena en la mitad de tiempo. Aquant continúa avanzando, extendiendo la calidad de recuperación a contenidos en alemán, neerlandés y japonés sin pipelines de anotación personalizados.