Financial ServicesCustomer Service

Cómo Vanguard usa Pinecone para mejorar el soporte al cliente con respuestas un 12 % más precisas

Vanguard se asoció con Pinecone para construir Agent Assist, una herramienta interna de chat de IA con RAG que ayuda a los representantes de atención al cliente a encontrar respuestas más rápido y con mayor precisión. Al reemplazar la búsqueda basada en palabras clave con recuperación vectorial híbrida, Vanguard logró un 12 % más de precisión en los resultados de búsqueda y redujo notablemente los tiempos de llamada, incluso durante períodos de alta demanda como la temporada fiscal.

Impacto

12%

Mejora en la precisión de los resultados de búsqueda

Reduced

Tiempos de llamada al cliente

Reduced

Sobrecarga operativa en temporadas pico

Desafío

Los equipos de soporte al cliente de Vanguard dependían de una búsqueda basada en palabras clave que devolvía enlaces a documentos extensos, obligando a los agentes a buscar manualmente respuestas, lo que aumentaba los tiempos de llamada, reducía la satisfacción y requería contrataciones estacionales costosas. El equipo necesitaba una solución de recuperación escalable y en tiempo real capaz de manejar un conjunto de datos de documentos financieros altamente dinámico.

Solución

El equipo CAI de Vanguard construyó Agent Assist, un asistente de chat interno con RAG que utiliza Pinecone Serverless como base de datos vectorial, combinando embeddings dispersos BM25 con embeddings densos para recuperación híbrida, y aprovechando el filtrado de metadatos para garantizar que los agentes siempre accedan a los documentos más actualizados.

Herramientas y tecnologías

Lo que dicen los líderes

One of the reasons we chose Pinecone beyond functionality is because Pinecone was willing to work with Vanguard, specifically to meet our security control and performance requirements by creating a dedicated AWS account and cluster for us.

Hung Pham, ML Engineer at Vanguard
Get the full story.

Sign up to read complete case studies, access detailed metrics, and unlock all use cases.

Historia completa

Vanguard, una de las empresas de gestión de inversiones más grandes del mundo, ha priorizado durante mucho tiempo la entrega de experiencias excepcionales para sus clientes, incluida la atención al cliente ágil y bien informada. Con millones de clientes que dependen de Vanguard para la planificación de jubilación, inversiones y asesoría financiera, la calidad y la velocidad de las interacciones de soporte tienen consecuencias financieras reales. El equipo del Centro de Análisis e Información (CAI), que opera dentro de la Dirección de Análisis de Datos, tenía la tarea de modernizar la forma en que los representantes de servicio al cliente acceden a la información durante las llamadas en vivo.

El desafío principal era un problema de recuperación. Los equipos de soporte de Vanguard utilizaban búsqueda basada en palabras clave para localizar documentos financieros relevantes, pero este enfoque solo devolvía enlaces a archivos fuente extensos, dejando a los agentes revisar manualmente contenido denso para encontrar respuestas específicas. Esta ineficiencia aumentaba los tiempos de llamada y erosionaba la satisfacción del cliente. Durante períodos pico como la temporada fiscal, la solución alternativa tradicional de Vanguard era contratar representantes adicionales para absorber el volumen, añadiendo un costo operativo significativo sin abordar la causa raíz.

Para superar la búsqueda por palabras clave, el equipo CAI primero experimentó con almacenamiento JSON y recuperación basada en similitud de coseno. Estas soluciones iniciales resultaron demasiado lentas, tenían dificultades para escalar con conjuntos de datos crecientes y con frecuencia devolvían resultados que carecían de relevancia contextual. El equipo evaluó entonces una gama de opciones de bases de datos vectoriales, incluidas pgvector, Faiss y Redis, antes de seleccionar Pinecone. Los factores clave de decisión incluyeron el soporte de Pinecone para búsqueda híbrida (combinando embeddings dispersos BM25 con embeddings densos), capacidades de indexación en tiempo real, filtrado avanzado de metadatos para cumplimiento normativo y características de seguridad de nivel empresarial como AWS PrivateLink. Pinecone también trabajó directamente con Vanguard para aprovisionar una cuenta y un clúster de AWS dedicado adaptado a sus requisitos de seguridad y rendimiento.

El sistema resultante, llamado Agent Assist, es un asistente de chat interno con RAG construido sobre Pinecone Serverless. Los documentos financieros almacenados como páginas HTML se extraen, se preprocesan con una estrategia de fragmentación personalizada y se codifican en embeddings densos y dispersos duales, con embeddings dispersos entrenados internamente mediante BM25. La recuperación híbrida se configura con un valor Alpha de 0,5 para equilibrar la precisión en la terminología financiera específica del dominio. Para garantizar que los agentes siempre accedan a información actualizada, los documentos se etiquetan diariamente como «activos» o «obsoletos» mediante filtrado de metadatos, archivándose los documentos desactualizados en DynamoDB para el cumplimiento normativo.

Desde la implementación de Agent Assist, Vanguard ha visto mejoras medibles en precisión, eficiencia y cumplimiento. La recuperación híbrida mejoró la precisión de los resultados de búsqueda en más del 12 % en comparación con la recuperación solo densa. Los tiempos de llamada se redujeron a medida que los agentes podían obtener respuestas precisas en tiempo real, y el equipo ya no necesita escalar el personal durante las temporadas pico para gestionar el volumen. El etiquetado de metadatos también introdujo una mayor trazabilidad de auditoría, respaldando las obligaciones de cumplimiento de Vanguard. De cara al futuro, Vanguard planea expandir su uso de sistemas RAG y de Generación Consciente del Contexto (CAG), con Pinecone como capa fundamental en su ecosistema de conocimiento de IA más amplio.

Casos similares

N
nCino
3.5x
faster document filing

nCino, a cloud-based banking platform serving 2,800+ financial institutions, built domain-specific AI tools on Databricks and AWS leveraging 13 years of proprietary banking data. Their Banking Advisor delivers role-based AI insights natively within the platform, while Continuous Credit Monitoring automates risk alerts across the loan lifecycle. The result is 3.5x faster document processing and a shift from reactive to proactive portfolio management.

Financial ServicesAAWSSSalesforce
N
N26
70%
task automation in targeted processes

N26 deployed Claude via AWS Bedrock across 15+ internal use cases in its first year, automating up to 70% of tasks in targeted customer service processes and cutting manual processing by 50% across 24 European markets. New AI implementations now go from ideation to evaluation in 1–2 weeks.

Financial ServicesABAmazon BedrockCEClaude Enterprise
C
Campfire
3 days
reduction in monthly close time

Campfire embedded Claude into its accounting platform to automate monthly closes, bank reconciliation, and financial reporting. Customers now close their books 3 days faster, reconcile bank statements 90% faster, and generate reports 50% faster. Claude powers Ember, Campfire's AI chat interface for natural language financial queries.

Financial ServicesCAClaude API
NB
Norges Bank Investment Management
20%
weekly time savings per employee

Norges Bank Investment Management deployed Claude Enterprise to 600+ employees across all departments, achieving 20% weekly time savings on analytical and operational tasks. The $1.7 trillion sovereign wealth fund uses Claude for investment research synthesis, ESG compliance across 9,000 portfolio companies, and multilingual information processing. Business users can now prototype AI solutions independently without IT bottlenecks.

Financial ServicesCEClaude Enterprise
IG
IG Group
70
hours saved weekly for analysts through ai-assisted query handling

IG Group, an international financial services firm, deployed Claude across teams to streamline content production, multilingual communications, and data analytics workflows. The rollout reduced reliance on external agencies, delivered a sub-three-month payback on the AI investment, and saved analysts 70 hours per week through AI-assisted query handling.

Online TradingFinancial ServicesCClaude
L
loanDepot
<5 minutes
it approval turnaround

loanDepot deployed Moveworks' AI assistant in Microsoft Teams to automate IT approvals, resolving 2,000 issues monthly and cutting turnaround from days to under 5 minutes.

Financial ServicesMMoveworksSServiceNow
E
Experian
~300
engineering days saved

Experian’s Data Office in the UK manages mission-critical consumer and business information infrastructure for one of the world’s largest credit bureaus. Facing seven legacy .NET Framework applications that required manual modernization, the team used AWS Transform — an agentic AI service for .NET migration — to automate code transformation and wave planning. The result: approximately 300 engineering days saved, 687,600 lines of code transformed, and 40% reduction in developer effort across seven applications.

Financial ServicesATAWS TransformAQAmazon Q Developer
TX
Terminal X
0.68 to 0.91
f1 retrieval accuracy improvement

Terminal X is a vertical AI platform for institutional investors that acts as a 24/7 research agent, processing millions of financial documents for hedge funds, asset managers, and private equity firms. By rebuilding its retrieval architecture on Pinecone’s vector database, Terminal X improved F1 retrieval accuracy from 0.68 to 0.91, cut average latency by over 35%, and doubled deployment velocity. Users now save approximately three hours per day, and investment memo preparation dropped from two days to half a day.

TechnologyFinancial ServicesPPinecone