Cómo ZoomInfo usa Pinecone para ofrecer recomendaciones de contactos en tiempo real a escala
ZoomInfo, una plataforma de inteligencia go-to-market B2B con cientos de millones de registros de contactos profesionales, necesitaba una base de datos vectorial para impulsar recomendaciones de contactos personalizadas en tiempo real para equipos de ventas y marketing. La empresa desplegó la base de datos vectorial serverless de Pinecone con Dedicated Read Nodes para ejecutar búsqueda semántica sobre 390 millones de embeddings de contactos con latencia inferior a un segundo. El resultado fue un aumento del 50% en la participación de los usuarios, una mejora de 2x en la relevancia de las recomendaciones y 50x más capacidad de solicitudes en hora punta.
Impacto
>50%
Aumento en la participación de usuarios
2x
Mejora en relevancia y recall
50x
Aumento en solicitudes de clientes en hora punta
390 million+
Vectores de contacto en el sistema de producción
~60ms
Latencia P50 de consulta
3 weeks
Tiempo para una prueba de concepto funcional
Desafío
ZoomInfo necesitaba ofrecer recomendaciones de contactos personalizadas en tiempo real sobre 390 millones de embeddings con latencia inferior a un segundo, sin añadir la carga operativa de gestionar infraestructura vectorial distribuida.
Solución
ZoomInfo desplegó la base de datos vectorial serverless de Pinecone con Dedicated Read Nodes para ejecutar búsqueda semántica sobre 390 millones de embeddings de contactos, habilitando recomendaciones instantáneas con un rendimiento de baja latencia predecible a medida que el tráfico escaló.
Herramientas y tecnologías
Lo que dicen los líderes
“La arquitectura slab y los Dedicated Read Nodes de Pinecone nos dieron la velocidad, consistencia y aislamiento que necesitábamos para ejecutar recomendaciones en tiempo real a escala. En lugar de gestionar infraestructura, dedicamos nuestro tiempo a mejorar nuestro modelo de recomendación y el producto en sí. Eso ha reducido el tiempo que nuestros clientes dedican a investigar, filtrar y evaluar contactos—de horas a minutos—dándoles las personas adecuadas con un solo clic.”
“Pinecone nos permitió construir, escalar y optimizar un sistema de recomendación de contactos en tiempo real que procesa miles de consultas de búsqueda vectorial de modelos de embeddings de gran tamaño por segundo, lo que ha impulsado una mejora de 2x en relevancia y un aumento del 50% en la participación de usuarios.”
Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.
Historia completa
ZoomInfo proporciona a los equipos de ventas y marketing de todo el mundo acceso a cientos de millones de registros de contactos profesionales, enriquecidos con datos firmográficos y capacidades de búsqueda impulsadas por IA. Para sus clientes, la capacidad de identificar rápidamente a la persona adecuada dentro de una cuenta objetivo—y actuar sobre esa información—está directamente vinculada al pipeline y los ingresos. Incluso pequeñas mejoras en cómo se muestran los contactos se traducen en ahorros de tiempo significativos y mejores resultados para los equipos go-to-market.
La experiencia de descubrimiento de contactos existente en ZoomInfo requería que los usuarios buscaran, filtraran y navegaran manualmente por grandes volúmenes de datos de contactos. Identificar a los compradores más relevantes dentro de una cuenta objetivo podía llevar horas de trabajo manual. La plataforma carecía de una forma de mostrar recomendaciones clasificadas y personalizadas en el momento en que un usuario consultaba el perfil de una empresa.
El equipo de Applied AI de ZoomInfo construyó un sistema de recomendación de contactos en tiempo real usando un modelo de embeddings de texto de ~400M parámetros y Pinecone como base de datos vectorial. En tres semanas, el equipo había cargado millones de embeddings y validado latencia inferior a un segundo sin configuración manual de índices. La arquitectura slab serverless de Pinecone almacena vectores en grandes unidades contiguas, garantizando que las escrituras y lecturas procedan en paralelo sin bloquearse. Para el tráfico a escala de producción, el equipo desplegó Pinecone Dedicated Read Nodes—réplicas de lectura aisladas con memoria cálida y SSD local—entregando un rendimiento de baja latencia predecible bajo cargas de trabajo de alto QPS sostenido. El sistema escaló a más de 390 millones de vectores en más de 100.000 namespaces sin necesidad de re-arquitectar la infraestructura.
El sistema en producción alcanzó una latencia P50 de ~60ms a ~40 QPS, manteniendo la latencia del servicio de recomendación extremo a extremo por debajo de un segundo para cargas estándar. La relevancia mejoró 2x, la participación de usuarios aumentó más del 50% y el sistema sirvió 50x más solicitudes en hora punta que la implementación anterior. Lo que antes requería horas de investigación manual se redujo a un solo clic: en el momento en que un usuario consulta el perfil de una empresa, la plataforma muestra instantáneamente los contactos más relevantes.
ZoomInfo planea ampliar las recomendaciones impulsadas por Pinecone a productos adicionales, segmentos de clientes y aplicaciones internas. El despliegue demuestra un cambio más amplio en el software B2B: las plataformas que pueden mostrar la información correcta instantáneamente, en lugar de después de una búsqueda manual, están redefiniendo lo que significa la inteligencia go-to-market.