Cómo Pinterest Entrega 10 Millones de Recomendaciones de IA por Segundo en AWS

Pinterest construyó un motor de descubrimiento con IA en AWS que procesa 18 TB diarios, entregando 10 millones de recomendaciones de IA por segundo en más de 10.000 instancias GPU, impulsando un crecimiento de ingresos del 17% y un 70% de descubrimiento impulsado por IA.

Impacto

17% YoY

Crecimiento de Ingresos

70%

Descubrimiento Impulsado por IA

11%

Crecimiento de Usuarios Activos Mensuales

10M per second

Recomendaciones de IA

Desafío

Necesitaba procesar miles de millones de imágenes y entregar recomendaciones personalizadas desde más de 500 petabytes de contenido, manteniendo la confianza de los usuarios a escala masiva.

Solución

Construyó una arquitectura de microservicios en AWS con más de 10.000 instancias GPU, el modelo de difusión Pinterest Canvas, búsqueda visual que reconoce 2.500 millones de objetos y un asistente de IA habilitado por voz.

Herramientas y tecnologías

Lo que dicen los líderes

Durante más de una década, hemos aprovechado la IA para crear una experiencia en línea únicamente positiva, esforzándonos por hacer que cada momento en Pinterest sea enriquecedor, no adictivo.

Kartik Paramasivam, Arquitecto Jefe, Pinterest
Entiende todo el contexto.

Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.

Historia completa

Pinterest necesitaba procesar miles de millones de imágenes y entregar recomendaciones personalizadas a partir de más de 500 petabytes de contenido, manteniendo la confianza de los usuarios a una escala masiva. Los sistemas tradicionales de recomendación no podían manejar el volumen ni ofrecer la personalización visual que los usuarios esperaban.

Pinterest construyó una arquitectura de microservicios en AWS con más de 10.000 instancias GPU, el modelo de difusión Pinterest Canvas, búsqueda visual que reconoce 2.500 millones de objetos y un asistente de IA habilitado por voz. El sistema procesa 18 TB de datos diariamente para entregar recomendaciones en tiempo real.

La plataforma ahora entrega 10 millones de recomendaciones de IA por segundo. El descubrimiento impulsado por IA representa el 70% de todas las interacciones, los ingresos crecieron un 17% interanual y los usuarios activos mensuales aumentaron un 11%.

Casos similares

P
Postman
Up to 1,150/year
developer hours saved

Postman selected Claude Opus 4.6 as the default model for Agent Mode, saving developers up to 1,150 hours per year and nearly $1M annually for a 10-person team in API development automation.

TechnologyCAClaude APIABAmazon Bedrock
A
ASAPP
91%
first-call resolution rate

ASAPP is an AI-native customer service platform that orchestrates large language models to automate contact center interactions for enterprise clients. By deploying Anthropic’s Claude through Amazon Bedrock, ASAPP eliminated its homegrown PII redaction layer and reduced call escalations by up to 40%, while helping clients achieve a 91% first-call resolution rate. The platform now automates more than 90% of contact center interactions, with human agents freed to handle three times the volume of complex cases.

TechnologyABAmazon BedrockCClaude
I
Intuit
Higher
helpfulness rating vs. non-claude experiences

Intuit integrated Claude via Amazon Bedrock into its Intuit Assist feature within TurboTax to generate plain-language explanations of tax calculations. The integration combines Claude's natural language capabilities with Intuit's proprietary tax knowledge engine, serving millions of customers during peak tax season. The result was higher helpfulness ratings and improved completion rates for federal tax filings.

Financial ServicesTechnologyIAIntuit AssistABAmazon Bedrock
B
Braintrust
25%
increase in job applicants

Braintrust is an AI-powered recruiting platform that connects employers with vetted talent across North America. The company integrated Claude 3.5 Sonnet via Amazon Bedrock to power AI-driven interviews, job description generation, and candidate screening. The platform now processes 100% of initial talent screens with AI, saving over $150K in screening costs and increasing applicant volume by 25% for employers using its AI-generated job descriptions.

TechnologyABAmazon BedrockC3Claude 3.5 Sonnet
T
Tabnine
50%
improvement in response times

Tabnine integrated Claude 3.5 Sonnet via Amazon Bedrock into its AI coding assistant, serving over 1 million monthly developers. The migration delivered 50% faster response times, a 20% increase in free-to-paid conversions, and a 20-30% reduction in churn—while meeting strict security and compliance requirements for regulated industries.

TechnologyABAmazon BedrockCClaude
P
Pfizer
93%
database reduction

Pfizer achieved a 93% database reduction and 20% cost avoidance by migrating their global SAP environment to S/4HANA on IBM Power10 infrastructure.

PharmaceuticalsTechnologyICIBM ConsultingIPIBM Power Virtual Server
J
Jamf
Under 45 minutes
performance review skill build time

Jamf deployed Claude Enterprise across 16 departments, then built interactive workflow skills using Claude Cowork that transformed manual spreadsheet-based processes into guided, conversational experiences. Performance reviews that previously required months of effort are now built in under 45 minutes, and non-engineering teams independently create custom data dashboards.

TechnologyCEClaude EnterpriseCCClaude Cowork
C
Confluent
15,000+
hours saved monthly

Confluent, a data streaming platform company with 2,000+ employees and 4,000+ customers, deployed Glean to solve the knowledge fragmentation that came with rapid growth from 250 to 2,000+ employees across 20+ systems. Glean indexed the company's full tool stack — Slack, Salesforce, Confluence, and more — enabling instant knowledge retrieval across all teams. The result: 15,000+ hours saved monthly, a 13% increase in support team satisfaction, and over 70% employee adoption.

TechnologyGGlean