Cómo Assembled Reduce el Tiempo de Respuesta de Soporte un 95% con Pinecone RAG
Assembled es una plataforma de optimización de gestión de plantillas y soporte al cliente que sirve a empresas como Stripe, Etsy y DoorDash. Para potenciar Assembled Assist, la empresa construyó un pipeline RAG híbrido que combina la búsqueda vectorial de Pinecone con la recuperación por palabras clave de Algolia y LLMs de OpenAI y Anthropic. Las tareas de soporte que antes tardaban 40 minutos ahora se completan en 2 minutos, una reducción del 95% en el tiempo de gestión.
Impacto
~95%
Reducción del tiempo de gestión de tickets
2 minutes
Tiempo de finalización de tareas con IA
Desafío
Los agentes de soporte carecían de acceso rápido a respuestas precisas, necesitando hasta 40 minutos por ticket para buscar en bases de conocimiento y redactar respuestas manualmente, un proceso que no podía escalar a medida que crecían los volúmenes de soporte de los clientes.
Solución
Assembled construyó Assembled Assist, un pipeline RAG impulsado por Pinecone para recuperación vectorial semántica y Algolia para búsqueda por palabras clave, fusionados mediante Reciprocal Rank Fusion y completados por los LLMs de OpenAI y Anthropic para generar respuestas a tickets en segundos.
Herramientas y tecnologías
Lo que dicen los líderes
“Pinecone fue una elección obvia para nosotros. Necesitábamos movernos rápido, y Pinecone era el líder en el espacio de bases de datos vectoriales. Su rentabilidad y facilidad de integración han sido ventajas significativas, lo que nos permite centrarnos en generar valor en lugar de gestionar infraestructura. Podemos probar y ajustar sobre la marcha, lo cual es crucial para mantener una alta calidad de búsqueda y mejorar continuamente nuestras soluciones de soporte.”
Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.
Historia completa
Assembled ayuda a los equipos de soporte empresarial de empresas como Stripe, Etsy y DoorDash a funcionar de manera más eficiente, proporcionando herramientas para la gestión de plantillas, el seguimiento del rendimiento y la resolución de tickets. A medida que la IA comenzó a transformar las expectativas del servicio al cliente, Assembled vio una oportunidad para cerrar una brecha persistente: los agentes de soporte dedicaban demasiado tiempo a buscar respuestas precisas en lugar de entregarlas.
Antes de Assembled Assist, los agentes navegaban manualmente por bases de conocimiento, tickets anteriores y documentación de productos antes de redactar respuestas. Este proceso lento e inconsistente extendía las tareas rutinarias a 40 minutos por ticket. A medida que los volúmenes de soporte crecían, también lo hacía la ineficiencia: los agentes se ahogaban en trabajo de búsqueda en lugar de centrarse en las decisiones que realmente requerían experiencia humana.
Assembled construyó Assembled Assist como un motor de automatización de IA que analiza los tickets entrantes y genera respuestas contextuales de alta calidad. La capa de recuperación combina la base de datos vectorial de Pinecone para búsqueda semántica con Algolia para coincidencia por palabras clave, fusionados mediante Reciprocal Rank Fusion para mostrar los resultados más relevantes independientemente de cómo se formule una pregunta. Los LLMs de OpenAI y Anthropic generan entonces la respuesta. El equipo eligió una arquitectura RAG sobre el ajuste fino, priorizando la flexibilidad de los prompts y la iteración rápida a medida que los modelos base continúan mejorando.
El impacto fue notable: las tareas que tardaban 40 minutos ahora se completan en 2 minutos, una reducción de aproximadamente el 95% en el tiempo de gestión. Los agentes pueden procesar más tickets con mayor consistencia, y el equipo de ingeniería de Assembled se centra en la calidad de los prompts y la curación de datos en lugar de en la infraestructura de modelos.
La arquitectura de Assembled refleja hacia dónde se dirige la IA empresarial: componer componentes especializados en lugar de entrenar desde cero. A medida que los modelos base mejoran, su apuesta por un RAG flexible y basado en prompts sobre modelos ajustados posiciona a Assembled para absorber esas mejoras automáticamente, multiplicando el valor entregado a cada equipo de soporte de la plataforma.