Lee el Informe — Estado de la IA Aplicada →

Cómo ZoomInfo usa Pinecone para ofrecer recomendaciones de contactos en tiempo real a escala

ZoomInfo, una plataforma de inteligencia go-to-market B2B con cientos de millones de registros de contactos profesionales, necesitaba una base de datos vectorial para impulsar recomendaciones de contactos personalizadas en tiempo real para equipos de ventas y marketing. La empresa desplegó la base de datos vectorial serverless de Pinecone con Dedicated Read Nodes para ejecutar búsqueda semántica sobre 390 millones de embeddings de contactos con latencia inferior a un segundo. El resultado fue un aumento del 50% en la participación de los usuarios, una mejora de 2x en la relevancia de las recomendaciones y 50x más capacidad de solicitudes en hora punta.

Impacto

>50%

Aumento en la participación de usuarios

2x

Mejora en relevancia y recall

50x

Aumento en solicitudes de clientes en hora punta

390 million+

Vectores de contacto en el sistema de producción

~60ms

Latencia P50 de consulta

3 weeks

Tiempo para una prueba de concepto funcional

Desafío

ZoomInfo necesitaba ofrecer recomendaciones de contactos personalizadas en tiempo real sobre 390 millones de embeddings con latencia inferior a un segundo, sin añadir la carga operativa de gestionar infraestructura vectorial distribuida.

Solución

ZoomInfo desplegó la base de datos vectorial serverless de Pinecone con Dedicated Read Nodes para ejecutar búsqueda semántica sobre 390 millones de embeddings de contactos, habilitando recomendaciones instantáneas con un rendimiento de baja latencia predecible a medida que el tráfico escaló.

Herramientas y tecnologías

Lo que dicen los líderes

La arquitectura slab y los Dedicated Read Nodes de Pinecone nos dieron la velocidad, consistencia y aislamiento que necesitábamos para ejecutar recomendaciones en tiempo real a escala. En lugar de gestionar infraestructura, dedicamos nuestro tiempo a mejorar nuestro modelo de recomendación y el producto en sí. Eso ha reducido el tiempo que nuestros clientes dedican a investigar, filtrar y evaluar contactos—de horas a minutos—dándoles las personas adecuadas con un solo clic.

Carlos Nunez, Vicepresidente de Ingeniería e IA Aplicada en ZoomInfo

Pinecone nos permitió construir, escalar y optimizar un sistema de recomendación de contactos en tiempo real que procesa miles de consultas de búsqueda vectorial de modelos de embeddings de gran tamaño por segundo, lo que ha impulsado una mejora de 2x en relevancia y un aumento del 50% en la participación de usuarios.

Tamiro Scholer, Científico de Datos Sénior en ZoomInfo
Entiende todo el contexto.

Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.

Historia completa

ZoomInfo proporciona a los equipos de ventas y marketing de todo el mundo acceso a cientos de millones de registros de contactos profesionales, enriquecidos con datos firmográficos y capacidades de búsqueda impulsadas por IA. Para sus clientes, la capacidad de identificar rápidamente a la persona adecuada dentro de una cuenta objetivo—y actuar sobre esa información—está directamente vinculada al pipeline y los ingresos. Incluso pequeñas mejoras en cómo se muestran los contactos se traducen en ahorros de tiempo significativos y mejores resultados para los equipos go-to-market.

La experiencia de descubrimiento de contactos existente en ZoomInfo requería que los usuarios buscaran, filtraran y navegaran manualmente por grandes volúmenes de datos de contactos. Identificar a los compradores más relevantes dentro de una cuenta objetivo podía llevar horas de trabajo manual. La plataforma carecía de una forma de mostrar recomendaciones clasificadas y personalizadas en el momento en que un usuario consultaba el perfil de una empresa.

El equipo de Applied AI de ZoomInfo construyó un sistema de recomendación de contactos en tiempo real usando un modelo de embeddings de texto de ~400M parámetros y Pinecone como base de datos vectorial. En tres semanas, el equipo había cargado millones de embeddings y validado latencia inferior a un segundo sin configuración manual de índices. La arquitectura slab serverless de Pinecone almacena vectores en grandes unidades contiguas, garantizando que las escrituras y lecturas procedan en paralelo sin bloquearse. Para el tráfico a escala de producción, el equipo desplegó Pinecone Dedicated Read Nodes—réplicas de lectura aisladas con memoria cálida y SSD local—entregando un rendimiento de baja latencia predecible bajo cargas de trabajo de alto QPS sostenido. El sistema escaló a más de 390 millones de vectores en más de 100.000 namespaces sin necesidad de re-arquitectar la infraestructura.

El sistema en producción alcanzó una latencia P50 de ~60ms a ~40 QPS, manteniendo la latencia del servicio de recomendación extremo a extremo por debajo de un segundo para cargas estándar. La relevancia mejoró 2x, la participación de usuarios aumentó más del 50% y el sistema sirvió 50x más solicitudes en hora punta que la implementación anterior. Lo que antes requería horas de investigación manual se redujo a un solo clic: en el momento en que un usuario consulta el perfil de una empresa, la plataforma muestra instantáneamente los contactos más relevantes.

ZoomInfo planea ampliar las recomendaciones impulsadas por Pinecone a productos adicionales, segmentos de clientes y aplicaciones internas. El despliegue demuestra un cambio más amplio en el software B2B: las plataformas que pueden mostrar la información correcta instantáneamente, en lugar de después de una búsqueda manual, están redefiniendo lo que significa la inteligencia go-to-market.

Casos similares

1
1up
10x faster
response generation speed for rfps and compliance questionnaires

1up, a sales knowledge automation platform, integrated Pinecone's vector database to power a RAG-based system that delivers real-time, highly accurate answers to complex sales queries. The solution replaced a slow, home-grown embedding system and achieved 10x faster response generation for RFPs and compliance questionnaires. Sales reps can now handle high volumes of queries with confidence, reducing reliance on colleagues and accelerating the go-to-market process.

TechnologyPPineconeAAWS
C
CustomGPT.ai
>400M
vectors stored

CustomGPT.ai built a RAG-as-a-Service platform on Pinecone storing over 400M vectors, achieving sub-20ms query latency and the #1 ranking in an independent RAG accuracy benchmark.

TechnologyPPinecone
D
Delphi
>100M
vectors stored

Delphi is an AI platform that enables coaches, creators, and experts to deploy interactive “Digital Minds”—always-on conversational agents trained on their unique content. Scaling from proof of concept to a commercial platform with thousands of customers required a vector database that could support millions of isolated namespaces, billions of vectors, and sub-second retrieval under variable load. Delphi selected Pinecone, achieving P95 query latency of 100ms and keeping retrieval under 30% of total response time—freeing the engineering team to build product rather than manage infrastructure.

TechnologyPPinecone
TX
Terminal X
0.68 to 0.91
f1 retrieval accuracy improvement

Terminal X is a vertical AI platform for institutional investors that acts as a 24/7 research agent, processing millions of financial documents for hedge funds, asset managers, and private equity firms. By rebuilding its retrieval architecture on Pinecone’s vector database, Terminal X improved F1 retrieval accuracy from 0.68 to 0.91, cut average latency by over 35%, and doubled deployment velocity. Users now save approximately three hours per day, and investment memo preparation dropped from two days to half a day.

Financial ServicesTechnologyPPinecone
A
Assembled
~95%
ticket handling time reduction

Assembled is a workforce management and customer support optimization platform serving enterprises like Stripe, Etsy, and DoorDash. To power Assembled Assist, the company built a hybrid RAG pipeline combining Pinecone vector search with Algolia keyword retrieval and LLMs from OpenAI and Anthropic. Support tasks that previously took 40 minutes now complete in 2 minutes—a 95% reduction in handling time.

TechnologyPPineconeOLOpenAI LLMs
G
Gong
10x
infrastructure cost reduction

Gong is a revenue intelligence platform that analyzes billions of customer interactions to help sales teams improve performance. To power Smart Trackers—its patented AI system for detecting and classifying concepts in sales conversations—Gong adopted Pinecone as its core vector database, storing billions of sentence-level embeddings across real conversations. Migrating to Pinecone Serverless delivered a 10x reduction in infrastructure costs while sustaining peak search performance across a massive corpus.

TechnologyPPinecone
P
Pfizer
93%
database reduction

Pfizer achieved a 93% database reduction and 20% cost avoidance by migrating their global SAP environment to S/4HANA on IBM Power10 infrastructure.

PharmaceuticalsTechnologyIPIBM Power10IPIBM PowerVM
C
Classmethod
up to 90%
reduction in development time

Classmethod, a leading Japanese cloud integrator, deployed Claude Code across its engineering teams to address chronic developer shortages. The tool automated code generation, review, and testing workflows, reducing development time by up to 90% on specific tasks and cutting code review time by 80%.

TechnologyCCClaude Code