Servicios FinancierosAtención al Cliente

Cómo Vanguard usa Pinecone para mejorar el soporte al cliente con respuestas un 12 % más precisas

Vanguard se asoció con Pinecone para construir Agent Assist, una herramienta interna de chat de IA con RAG que ayuda a los representantes de atención al cliente a encontrar respuestas más rápido y con mayor precisión. Al reemplazar la búsqueda basada en palabras clave con recuperación vectorial híbrida, Vanguard logró un 12 % más de precisión en los resultados de búsqueda y redujo notablemente los tiempos de llamada, incluso durante períodos de alta demanda como la temporada fiscal.

Impacto

12%

Mejora en la precisión de los resultados de búsqueda

Reduced

Tiempos de llamada al cliente

Reduced

Sobrecarga operativa en temporadas pico

Desafío

Los equipos de soporte al cliente de Vanguard dependían de una búsqueda basada en palabras clave que devolvía enlaces a documentos extensos, obligando a los agentes a buscar manualmente respuestas, lo que aumentaba los tiempos de llamada, reducía la satisfacción y requería contrataciones estacionales costosas. El equipo necesitaba una solución de recuperación escalable y en tiempo real capaz de manejar un conjunto de datos de documentos financieros altamente dinámico.

Solución

El equipo CAI de Vanguard construyó Agent Assist, un asistente de chat interno con RAG que utiliza Pinecone Serverless como base de datos vectorial, combinando embeddings dispersos BM25 con embeddings densos para recuperación híbrida, y aprovechando el filtrado de metadatos para garantizar que los agentes siempre accedan a los documentos más actualizados.

Herramientas y tecnologías

Lo que dicen los líderes

Una de las razones por las que elegimos Pinecone más allá de la funcionalidad es porque Pinecone estuvo dispuesto a trabajar con Vanguard específicamente para cumplir con nuestros requisitos de control de seguridad y rendimiento, creando una cuenta y un clúster de AWS dedicados para nosotros.

Hung Pham, Ingeniero de ML en Vanguard
Entiende todo el contexto.

Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.

Historia completa

Vanguard, una de las empresas de gestión de inversiones más grandes del mundo, ha priorizado durante mucho tiempo la entrega de experiencias excepcionales para sus clientes, incluida la atención al cliente ágil y bien informada. Con millones de clientes que dependen de Vanguard para la planificación de jubilación, inversiones y asesoría financiera, la calidad y la velocidad de las interacciones de soporte tienen consecuencias financieras reales. El equipo del Centro de Análisis e Información (CAI), que opera dentro de la Dirección de Análisis de Datos, tenía la tarea de modernizar la forma en que los representantes de servicio al cliente acceden a la información durante las llamadas en vivo.

El desafío principal era un problema de recuperación. Los equipos de soporte de Vanguard utilizaban búsqueda basada en palabras clave para localizar documentos financieros relevantes, pero este enfoque solo devolvía enlaces a archivos fuente extensos, dejando a los agentes revisar manualmente contenido denso para encontrar respuestas específicas. Esta ineficiencia aumentaba los tiempos de llamada y erosionaba la satisfacción del cliente. Durante períodos pico como la temporada fiscal, la solución alternativa tradicional de Vanguard era contratar representantes adicionales para absorber el volumen, añadiendo un costo operativo significativo sin abordar la causa raíz.

Para superar la búsqueda por palabras clave, el equipo CAI primero experimentó con almacenamiento JSON y recuperación basada en similitud de coseno. Estas soluciones iniciales resultaron demasiado lentas, tenían dificultades para escalar con conjuntos de datos crecientes y con frecuencia devolvían resultados que carecían de relevancia contextual. El equipo evaluó entonces una gama de opciones de bases de datos vectoriales, incluidas pgvector, Faiss y Redis, antes de seleccionar Pinecone. Los factores clave de decisión incluyeron el soporte de Pinecone para búsqueda híbrida (combinando embeddings dispersos BM25 con embeddings densos), capacidades de indexación en tiempo real, filtrado avanzado de metadatos para cumplimiento normativo y características de seguridad de nivel empresarial como AWS PrivateLink. Pinecone también trabajó directamente con Vanguard para aprovisionar una cuenta y un clúster de AWS dedicado adaptado a sus requisitos de seguridad y rendimiento.

El sistema resultante, llamado Agent Assist, es un asistente de chat interno con RAG construido sobre Pinecone Serverless. Los documentos financieros almacenados como páginas HTML se extraen, se preprocesan con una estrategia de fragmentación personalizada y se codifican en embeddings densos y dispersos duales, con embeddings dispersos entrenados internamente mediante BM25. La recuperación híbrida se configura con un valor Alpha de 0,5 para equilibrar la precisión en la terminología financiera específica del dominio. Para garantizar que los agentes siempre accedan a información actualizada, los documentos se etiquetan diariamente como «activos» o «obsoletos» mediante filtrado de metadatos, archivándose los documentos desactualizados en DynamoDB para el cumplimiento normativo.

Desde la implementación de Agent Assist, Vanguard ha visto mejoras medibles en precisión, eficiencia y cumplimiento. La recuperación híbrida mejoró la precisión de los resultados de búsqueda en más del 12 % en comparación con la recuperación solo densa. Los tiempos de llamada se redujeron a medida que los agentes podían obtener respuestas precisas en tiempo real, y el equipo ya no necesita escalar el personal durante las temporadas pico para gestionar el volumen. El etiquetado de metadatos también introdujo una mayor trazabilidad de auditoría, respaldando las obligaciones de cumplimiento de Vanguard. De cara al futuro, Vanguard planea expandir su uso de sistemas RAG y de Generación Consciente del Contexto (CAG), con Pinecone como capa fundamental en su ecosistema de conocimiento de IA más amplio.

Casos similares

B
Block
75% saving 8-10+ hours
engineers saving time weekly

Block, the financial technology company behind Square, Cash App, and Afterpay, deployed Claude as the default model in its open-source AI agent, codename goose, running through the Databricks Data Intelligence Platform. The system gives approximately 4,000 employees across 15 job profiles direct access to internal data, automated SQL generation, and AI-assisted code writing. Engineers report saving 8 to 10-plus hours per week, with goose adoption doubling within a single month.

Financial ServicesCGcodename gooseDDatabricks
SB
State Bank of India
64 million
app downloads

State Bank of India partnered with IBM to build YONO, a comprehensive mobile platform combining banking, financial services, and marketplace that achieved 64 million downloads and a USD 40-50 billion valuation.

Financial ServicesIAIBM API ConnectICIBM Consulting
N
nCino
3.5x
faster document filing

nCino, a cloud-based banking platform serving 2,800+ financial institutions, built domain-specific AI tools on Databricks and AWS leveraging 13 years of proprietary banking data. Their Banking Advisor delivers role-based AI insights natively within the platform, while Continuous Credit Monitoring automates risk alerts across the loan lifecycle. The result is 3.5x faster document processing and a shift from reactive to proactive portfolio management.

Financial ServicesAAWSSSalesforce
C
Campfire
3 days
reduction in monthly close time

Campfire embedded Claude into its accounting platform to automate monthly closes, bank reconciliation, and financial reporting. Customers now close their books 3 days faster, reconcile bank statements 90% faster, and generate reports 50% faster. Claude powers Ember, Campfire's AI chat interface for natural language financial queries.

Financial ServicesCAClaude API
BD
Bell Direct
20%
operational efficiency gain

Bell Direct, the online broking arm of Bell Financial Group, processes more than 800 client emails per day across service requests, client issues, and onboarding. The company deployed ClickUp AI Agents to fully automate email triage and task routing, replacing work that previously required two dedicated staff. The result was a 20% improvement in operational efficiency across the entire team.

Financial ServicesCSClickUp Super AgentsCBClickUp Brain
F
Fiserv
$10M
sla penalties avoided

Fiserv built safe, scalable AI automation on UiPath Platform with built-in governance, avoiding $10M in SLA penalties and onboarding 20,000+ QSR locations on schedule.

Financial ServicesUPUiPath Platform
TX
Terminal X
0.68 to 0.91
f1 retrieval accuracy improvement

Terminal X is a vertical AI platform for institutional investors that acts as a 24/7 research agent, processing millions of financial documents for hedge funds, asset managers, and private equity firms. By rebuilding its retrieval architecture on Pinecone’s vector database, Terminal X improved F1 retrieval accuracy from 0.68 to 0.91, cut average latency by over 35%, and doubled deployment velocity. Users now save approximately three hours per day, and investment memo preparation dropped from two days to half a day.

Financial ServicesTechnologyPPinecone
CC
Chipper Cash
95%+
selfie verification accuracy

Chipper Cash, a fintech serving over five million customers across Africa, deployed a Pinecone-powered facial similarity search system to detect and block fraudulent duplicate sign-ups in real time. The solution slashed identity verification latency from up to 20 minutes down to under 2 seconds, and reduced fraudulent sign-ups by 10x across all markets.

Financial ServicesGCGoogle CloudSSnowflake