TecnologíaIngeniería de Software

Cómo Gong Logra un Ahorro de Costes 10x con Pinecone Serverless para Smart Trackers

Gong es una plataforma de inteligencia de ingresos que analiza miles de millones de interacciones con clientes para ayudar a los equipos de ventas a mejorar su rendimiento. Para potenciar Smart Trackers, su sistema de IA patentado para detectar y clasificar conceptos en conversaciones de ventas, Gong adoptó Pinecone como su base de datos vectorial principal, almacenando miles de millones de embeddings a nivel de frase en conversaciones reales. La migración a Pinecone Serverless logró una reducción 10x en los costes de infraestructura manteniendo el máximo rendimiento de búsqueda en un corpus masivo.

Impacto

10x

Reducción de costes de infraestructura

Billions

Vectores almacenados

Desafío

Gong necesitaba rastrear y clasificar conceptos complejos y contextualmente variados en miles de millones de frases de conversaciones sin depender de la coincidencia frágil por palabras clave, y hacerlo a un coste y latencia que permitieran la interacción en tiempo real con el usuario.

Solución

Gong desplegó Pinecone como base de datos vectorial para Smart Trackers, almacenando miles de millones de embeddings de frases para habilitar la recuperación semántica que impulsa un bucle de aprendizaje activo, y luego migró a Pinecone Serverless para lograr una reducción de costes 10x con un rendimiento equivalente.

Herramientas y tecnologías

Lo que dicen los líderes

Los usuarios quieren rastrear diferentes conceptos que aparecen en las conversaciones, y las palabras clave simples no funcionan.

Jacob Eckel, VP, Director de División I+D, Gong

Nuestra decisión de trabajar con Pinecone no se basó solo en la tecnología; se fundamentó en su compromiso con nuestro éxito. Escucharon, entendieron y superaron nuestras expectativas.

Jacob Eckel, VP, Director de División I+D, Gong
Entiende todo el contexto.

Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.

Historia completa

Gong ha construido uno de los repositorios de datos de conversaciones de ventas más ricos del mundo, analizando llamadas, correos electrónicos y reuniones para mostrar información de coaching y análisis de oportunidades. Ya en 2020, Gong fue una de las primeras plataformas de ingresos en desplegar una base de datos vectorial para búsqueda semántica a escala, reconociendo que la coincidencia por palabras clave no podía capturar los matices y la variación contextual de la conversación humana.

El desafío central era el seguimiento conceptual a escala empresarial. El sistema Smart Trackers de Gong permite a los gerentes de ventas definir conceptos —como la mención de un competidor o una objeción de precio— proporcionando unas pocas frases de ejemplo. El sistema recupera automáticamente ejemplos semánticamente similares de miles de millones de registros de conversaciones reales para entrenar un modelo de clasificación activo. La búsqueda por palabras clave tradicional falla aquí: las conversaciones son dinámicas y el mismo concepto surge en innumerables formulaciones. Solo la búsqueda por similitud vectorial puede encontrarlos de manera fiable.

Gong seleccionó Pinecone como su partner de base de datos vectorial, almacenando miles de millones de embeddings a nivel de frase y habilitando las búsquedas de similitud rápidas que impulsan el bucle de aprendizaje activo de Smart Trackers. Los usuarios etiquetan unas pocas frases, el sistema recupera candidatos semánticamente similares del corpus y el modelo mejora continuamente a través del feedback. Cuando Pinecone introdujo su arquitectura serverless, Gong migró y logró una reducción de costes 10x manteniendo el rendimiento en cargas máximas.

El impacto en el negocio es directo: Smart Trackers permite a los usuarios de Gong construir y ajustar modelos de detección de conceptos sin necesidad de experiencia técnica. Los gerentes de ventas, no los científicos de datos, definen lo que importa. La precisión y velocidad del sistema, sostenidas por la infraestructura de recuperación de Pinecone, hacen que este modelo de autoservicio sea práctico a escala.

La arquitectura de Gong demuestra un patrón cada vez más consolidado en el desarrollo de productos de IA: bases de datos vectoriales gestionadas como la columna vertebral de recuperación para sistemas de aprendizaje activo. A medida que crece el corpus de datos de conversaciones, crece también el valor de la infraestructura subyacente y la ventaja competitiva construida sobre el conjunto de datos propietario de Gong.

Casos similares

A
Allspice
20% → 97%
ingredient matching accuracy

Allspice, a food technology startup building a kitchen operating system for consumers and recipe publishers, deployed Pinecone’s vector database to solve the inherent messiness of ingredient data that traditional text search could not handle. The implementation raised ingredient matching accuracy from roughly 20% to 97%, enabling the launch of recipe importing as a core product feature and expanding into a platform-wide semantic layer for search, recommendations, and conversational AI.

TechnologyTtext-embedding-3-largePPinecone
A
Aquant
98%+
retrieval accuracy

Aquant is an agentic AI platform purpose-built for professionals servicing complex industrial and medical equipment at large manufacturing companies. When the company’s homegrown vector search infrastructure—built on PostgreSQL extensions—began to slow under real-time production demands, Aquant migrated to Pinecone as the retrieval backbone for its AI platform. The switch delivered sub-100ms semantic search, pushed retrieval accuracy above 98%, and helped Aquant’s customers cut average service resolution time by 49%.

TechnologyPPinecone
TX
Terminal X
0.68 to 0.91
f1 retrieval accuracy improvement

Terminal X is a vertical AI platform for institutional investors that acts as a 24/7 research agent, processing millions of financial documents for hedge funds, asset managers, and private equity firms. By rebuilding its retrieval architecture on Pinecone’s vector database, Terminal X improved F1 retrieval accuracy from 0.68 to 0.91, cut average latency by over 35%, and doubled deployment velocity. Users now save approximately three hours per day, and investment memo preparation dropped from two days to half a day.

Financial ServicesTechnologyPPinecone
C
CustomGPT.ai
>400M
vectors stored

CustomGPT.ai built a RAG-as-a-Service platform on Pinecone storing over 400M vectors, achieving sub-20ms query latency and the #1 ranking in an independent RAG accuracy benchmark.

TechnologyPPinecone
D
Delphi
>100M
vectors stored

Delphi is an AI platform that enables coaches, creators, and experts to deploy interactive “Digital Minds”—always-on conversational agents trained on their unique content. Scaling from proof of concept to a commercial platform with thousands of customers required a vector database that could support millions of isolated namespaces, billions of vectors, and sub-second retrieval under variable load. Delphi selected Pinecone, achieving P95 query latency of 100ms and keeping retrieval under 30% of total response time—freeing the engineering team to build product rather than manage infrastructure.

TechnologyPPinecone
1
1up
10x faster
response generation speed for rfps and compliance questionnaires

1up, a sales knowledge automation platform, integrated Pinecone's vector database to power a RAG-based system that delivers real-time, highly accurate answers to complex sales queries. The solution replaced a slow, home-grown embedding system and achieved 10x faster response generation for RFPs and compliance questionnaires. Sales reps can now handle high volumes of queries with confidence, reducing reliance on colleagues and accelerating the go-to-market process.

TechnologyAAWSPPinecone
A
Assembled
~95%
ticket handling time reduction

Assembled is a workforce management and customer support optimization platform serving enterprises like Stripe, Etsy, and DoorDash. To power Assembled Assist, the company built a hybrid RAG pipeline combining Pinecone vector search with Algolia keyword retrieval and LLMs from OpenAI and Anthropic. Support tasks that previously took 40 minutes now complete in 2 minutes—a 95% reduction in handling time.

TechnologyAAlgoliaOLOpenAI LLMs
Z
ZoomInfo
>50%
increase in user engagement

ZoomInfo, a B2B go-to-market intelligence platform with hundreds of millions of professional contact records, needed a vector database to power real-time personalized contact recommendations for sales and marketing teams. The company deployed Pinecone’s serverless vector database with Dedicated Read Nodes to run semantic search over 390 million contact embeddings with sub-second latency. The result was a 50% increase in user engagement, a 2x improvement in recommendation relevancy, and 50x more peak request capacity.

TechnologyPPinecone