Cómo Vanguard usa Pinecone para mejorar el soporte al cliente con respuestas un 12 % más precisas
Vanguard se asoció con Pinecone para construir Agent Assist, una herramienta interna de chat de IA con RAG que ayuda a los representantes de atención al cliente a encontrar respuestas más rápido y con mayor precisión. Al reemplazar la búsqueda basada en palabras clave con recuperación vectorial híbrida, Vanguard logró un 12 % más de precisión en los resultados de búsqueda y redujo notablemente los tiempos de llamada, incluso durante períodos de alta demanda como la temporada fiscal.
Impacto
12%
Mejora en la precisión de los resultados de búsqueda
Reduced
Tiempos de llamada al cliente
Reduced
Sobrecarga operativa en temporadas pico
Desafío
Los equipos de soporte al cliente de Vanguard dependían de una búsqueda basada en palabras clave que devolvía enlaces a documentos extensos, obligando a los agentes a buscar manualmente respuestas, lo que aumentaba los tiempos de llamada, reducía la satisfacción y requería contrataciones estacionales costosas. El equipo necesitaba una solución de recuperación escalable y en tiempo real capaz de manejar un conjunto de datos de documentos financieros altamente dinámico.
Solución
El equipo CAI de Vanguard construyó Agent Assist, un asistente de chat interno con RAG que utiliza Pinecone Serverless como base de datos vectorial, combinando embeddings dispersos BM25 con embeddings densos para recuperación híbrida, y aprovechando el filtrado de metadatos para garantizar que los agentes siempre accedan a los documentos más actualizados.
Herramientas y tecnologías
Lo que dicen los líderes
“One of the reasons we chose Pinecone beyond functionality is because Pinecone was willing to work with Vanguard, specifically to meet our security control and performance requirements by creating a dedicated AWS account and cluster for us.”
Sign up to read complete case studies, access detailed metrics, and unlock all use cases.
Historia completa
Vanguard, una de las empresas de gestión de inversiones más grandes del mundo, ha priorizado durante mucho tiempo la entrega de experiencias excepcionales para sus clientes, incluida la atención al cliente ágil y bien informada. Con millones de clientes que dependen de Vanguard para la planificación de jubilación, inversiones y asesoría financiera, la calidad y la velocidad de las interacciones de soporte tienen consecuencias financieras reales. El equipo del Centro de Análisis e Información (CAI), que opera dentro de la Dirección de Análisis de Datos, tenía la tarea de modernizar la forma en que los representantes de servicio al cliente acceden a la información durante las llamadas en vivo.
El desafío principal era un problema de recuperación. Los equipos de soporte de Vanguard utilizaban búsqueda basada en palabras clave para localizar documentos financieros relevantes, pero este enfoque solo devolvía enlaces a archivos fuente extensos, dejando a los agentes revisar manualmente contenido denso para encontrar respuestas específicas. Esta ineficiencia aumentaba los tiempos de llamada y erosionaba la satisfacción del cliente. Durante períodos pico como la temporada fiscal, la solución alternativa tradicional de Vanguard era contratar representantes adicionales para absorber el volumen, añadiendo un costo operativo significativo sin abordar la causa raíz.
Para superar la búsqueda por palabras clave, el equipo CAI primero experimentó con almacenamiento JSON y recuperación basada en similitud de coseno. Estas soluciones iniciales resultaron demasiado lentas, tenían dificultades para escalar con conjuntos de datos crecientes y con frecuencia devolvían resultados que carecían de relevancia contextual. El equipo evaluó entonces una gama de opciones de bases de datos vectoriales, incluidas pgvector, Faiss y Redis, antes de seleccionar Pinecone. Los factores clave de decisión incluyeron el soporte de Pinecone para búsqueda híbrida (combinando embeddings dispersos BM25 con embeddings densos), capacidades de indexación en tiempo real, filtrado avanzado de metadatos para cumplimiento normativo y características de seguridad de nivel empresarial como AWS PrivateLink. Pinecone también trabajó directamente con Vanguard para aprovisionar una cuenta y un clúster de AWS dedicado adaptado a sus requisitos de seguridad y rendimiento.
El sistema resultante, llamado Agent Assist, es un asistente de chat interno con RAG construido sobre Pinecone Serverless. Los documentos financieros almacenados como páginas HTML se extraen, se preprocesan con una estrategia de fragmentación personalizada y se codifican en embeddings densos y dispersos duales, con embeddings dispersos entrenados internamente mediante BM25. La recuperación híbrida se configura con un valor Alpha de 0,5 para equilibrar la precisión en la terminología financiera específica del dominio. Para garantizar que los agentes siempre accedan a información actualizada, los documentos se etiquetan diariamente como «activos» o «obsoletos» mediante filtrado de metadatos, archivándose los documentos desactualizados en DynamoDB para el cumplimiento normativo.
Desde la implementación de Agent Assist, Vanguard ha visto mejoras medibles en precisión, eficiencia y cumplimiento. La recuperación híbrida mejoró la precisión de los resultados de búsqueda en más del 12 % en comparación con la recuperación solo densa. Los tiempos de llamada se redujeron a medida que los agentes podían obtener respuestas precisas en tiempo real, y el equipo ya no necesita escalar el personal durante las temporadas pico para gestionar el volumen. El etiquetado de metadatos también introdujo una mayor trazabilidad de auditoría, respaldando las obligaciones de cumplimiento de Vanguard. De cara al futuro, Vanguard planea expandir su uso de sistemas RAG y de Generación Consciente del Contexto (CAG), con Pinecone como capa fundamental en su ecosistema de conocimiento de IA más amplio.