TecnologíaAtención al Cliente

Cómo Assembled Reduce el Tiempo de Respuesta de Soporte un 95% con Pinecone RAG

Assembled es una plataforma de optimización de gestión de plantillas y soporte al cliente que sirve a empresas como Stripe, Etsy y DoorDash. Para potenciar Assembled Assist, la empresa construyó un pipeline RAG híbrido que combina la búsqueda vectorial de Pinecone con la recuperación por palabras clave de Algolia y LLMs de OpenAI y Anthropic. Las tareas de soporte que antes tardaban 40 minutos ahora se completan en 2 minutos, una reducción del 95% en el tiempo de gestión.

Impacto

~95%

Reducción del tiempo de gestión de tickets

2 minutes

Tiempo de finalización de tareas con IA

Desafío

Los agentes de soporte carecían de acceso rápido a respuestas precisas, necesitando hasta 40 minutos por ticket para buscar en bases de conocimiento y redactar respuestas manualmente, un proceso que no podía escalar a medida que crecían los volúmenes de soporte de los clientes.

Solución

Assembled construyó Assembled Assist, un pipeline RAG impulsado por Pinecone para recuperación vectorial semántica y Algolia para búsqueda por palabras clave, fusionados mediante Reciprocal Rank Fusion y completados por los LLMs de OpenAI y Anthropic para generar respuestas a tickets en segundos.

Herramientas y tecnologías

Lo que dicen los líderes

Pinecone fue una elección obvia para nosotros. Necesitábamos movernos rápido, y Pinecone era el líder en el espacio de bases de datos vectoriales. Su rentabilidad y facilidad de integración han sido ventajas significativas, lo que nos permite centrarnos en generar valor en lugar de gestionar infraestructura. Podemos probar y ajustar sobre la marcha, lo cual es crucial para mantener una alta calidad de búsqueda y mejorar continuamente nuestras soluciones de soporte.

John Wang, Cofundador y CTO, Assembled
Entiende todo el contexto.

Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.

Historia completa

Assembled ayuda a los equipos de soporte empresarial de empresas como Stripe, Etsy y DoorDash a funcionar de manera más eficiente, proporcionando herramientas para la gestión de plantillas, el seguimiento del rendimiento y la resolución de tickets. A medida que la IA comenzó a transformar las expectativas del servicio al cliente, Assembled vio una oportunidad para cerrar una brecha persistente: los agentes de soporte dedicaban demasiado tiempo a buscar respuestas precisas en lugar de entregarlas.

Antes de Assembled Assist, los agentes navegaban manualmente por bases de conocimiento, tickets anteriores y documentación de productos antes de redactar respuestas. Este proceso lento e inconsistente extendía las tareas rutinarias a 40 minutos por ticket. A medida que los volúmenes de soporte crecían, también lo hacía la ineficiencia: los agentes se ahogaban en trabajo de búsqueda en lugar de centrarse en las decisiones que realmente requerían experiencia humana.

Assembled construyó Assembled Assist como un motor de automatización de IA que analiza los tickets entrantes y genera respuestas contextuales de alta calidad. La capa de recuperación combina la base de datos vectorial de Pinecone para búsqueda semántica con Algolia para coincidencia por palabras clave, fusionados mediante Reciprocal Rank Fusion para mostrar los resultados más relevantes independientemente de cómo se formule una pregunta. Los LLMs de OpenAI y Anthropic generan entonces la respuesta. El equipo eligió una arquitectura RAG sobre el ajuste fino, priorizando la flexibilidad de los prompts y la iteración rápida a medida que los modelos base continúan mejorando.

El impacto fue notable: las tareas que tardaban 40 minutos ahora se completan en 2 minutos, una reducción de aproximadamente el 95% en el tiempo de gestión. Los agentes pueden procesar más tickets con mayor consistencia, y el equipo de ingeniería de Assembled se centra en la calidad de los prompts y la curación de datos en lugar de en la infraestructura de modelos.

La arquitectura de Assembled refleja hacia dónde se dirige la IA empresarial: componer componentes especializados en lugar de entrenar desde cero. A medida que los modelos base mejoran, su apuesta por un RAG flexible y basado en prompts sobre modelos ajustados posiciona a Assembled para absorber esas mejoras automáticamente, multiplicando el valor entregado a cada equipo de soporte de la plataforma.

Casos similares

A
Aquant
98%+
retrieval accuracy

Aquant is an agentic AI platform purpose-built for professionals servicing complex industrial and medical equipment at large manufacturing companies. When the company’s homegrown vector search infrastructure—built on PostgreSQL extensions—began to slow under real-time production demands, Aquant migrated to Pinecone as the retrieval backbone for its AI platform. The switch delivered sub-100ms semantic search, pushed retrieval accuracy above 98%, and helped Aquant’s customers cut average service resolution time by 49%.

TechnologyPPinecone
H
Hostinger
Minutes vs. days
website creation time

Hostinger partnered with Anthropic to build Hostinger Horizons, an AI-powered platform that converts natural language prompts into complete, functional websites and applications. The solution eliminates the steep learning curve of traditional web builders, enabling non-technical users to create professional online presences in minutes instead of days.

TechnologyCClaude
TX
Terminal X
0.68 to 0.91
f1 retrieval accuracy improvement

Terminal X is a vertical AI platform for institutional investors that acts as a 24/7 research agent, processing millions of financial documents for hedge funds, asset managers, and private equity firms. By rebuilding its retrieval architecture on Pinecone’s vector database, Terminal X improved F1 retrieval accuracy from 0.68 to 0.91, cut average latency by over 35%, and doubled deployment velocity. Users now save approximately three hours per day, and investment memo preparation dropped from two days to half a day.

Financial ServicesTechnologyPPinecone
FD
Fifth Dimension
50x
document processing capacity increase

Fifth Dimension, a UK-based AI analytics company serving the real estate industry, migrated to Google Cloud to overcome critical infrastructure bottlenecks. By adopting Vertex AI, Cloud Run, and serverless architecture, the company achieved 50x processing scalability, 6x revenue growth, and a 30% reduction in infrastructure costs — all within a rapid growth trajectory from founding in 2023 to global scale by 2025.

TechnologyGCGoogle Cloud Pub/SubGCGoogle Cloud Run
C
CustomGPT.ai
>400M
vectors stored

CustomGPT.ai built a RAG-as-a-Service platform on Pinecone storing over 400M vectors, achieving sub-20ms query latency and the #1 ranking in an independent RAG accuracy benchmark.

TechnologyPPinecone
A
ASAPP
91%
first-call resolution rate

ASAPP is an AI-native customer service platform that orchestrates large language models to automate contact center interactions for enterprise clients. By deploying Anthropic’s Claude through Amazon Bedrock, ASAPP eliminated its homegrown PII redaction layer and reduced call escalations by up to 40%, while helping clients achieve a 91% first-call resolution rate. The platform now automates more than 90% of contact center interactions, with human agents freed to handle three times the volume of complex cases.

TechnologyABAmazon BedrockCClaude
D
Delphi
>100M
vectors stored

Delphi is an AI platform that enables coaches, creators, and experts to deploy interactive “Digital Minds”—always-on conversational agents trained on their unique content. Scaling from proof of concept to a commercial platform with thousands of customers required a vector database that could support millions of isolated namespaces, billions of vectors, and sub-second retrieval under variable load. Delphi selected Pinecone, achieving P95 query latency of 100ms and keeping retrieval under 30% of total response time—freeing the engineering team to build product rather than manage infrastructure.

TechnologyPPinecone
L
Lindy
10x
customer growth

Lindy's AI agent platform is built on Claude, enabling 10x customer growth, 72% reduction in time-to-qualified-lead, and handling 70%+ of routine support tickets.

TechnologyCClaude