TecnologíaIngeniería de Software

Cómo Notion Impulsa una Búsqueda de IA Precisa para Millones con Cohere Rerank

Notion, la plataforma de espacio de trabajo conectado utilizada por millones de personas en todo el mundo, integró Cohere Rerank en su pipeline de búsqueda para potenciar la precisión de búsqueda de Notion AI en espacios de trabajo empresariales multilingües. Cada búsqueda e interacción con Notion AI pasa ahora por Cohere Rerank, ofreciendo una relevancia notablemente mejorada a la vez que reduce el coste y la complejidad de la recuperación basada en embeddings para espacios de trabajo más pequeños.

Impacto

Millions

Usuarios de Notion AI alcanzados

From 100,000 to 200 documents

Mejora en precisión de recuperación

Eliminated embedding and vector storage for most workspaces

Reducción de costes

Desafío

Notion necesitaba un reranker de búsqueda que pudiera mejorar la precisión de las respuestas en grandes espacios de trabajo empresariales multilingües sin el coste y la carga de infraestructura de la recuperación basada en embeddings, a la vez que daba soporte a diversas bases de usuarios globales en EMEA y APAC.

Solución

Cohere Rerank se integró en el pipeline de búsqueda de Notion a través de Amazon SageMaker, ubicado antes del modelo generativo para mejorar la relevancia de los resultados, permitiendo a Notion omitir costosos embeddings en espacios de trabajo más pequeños y combinar resultados de búsqueda de múltiples fuentes como Slack, GitHub y otras herramientas conectadas.

Herramientas y tecnologías

Lo que dicen los líderes

Cohere es una parte clave de lo que hace funcionar Notion AI. Cohere Rerank nos ofrece tanto la velocidad como la calidad que necesitamos, y mejora constantemente. Ha sido esencial para lanzar nuestros AI Connectors rápidamente.

Simon Last, Cofundador y CTO, Notion

Cohere Rerank es uno de los únicos rerankers multilingüe de alta calidad y rápidos del mercado, y por eso lo usamos. Cada búsqueda e interacción con Notion AI pasa por Cohere Rerank.

Abhishek Modi, Ingeniero de Software, Notion

Una parte importante del pipeline de búsqueda es la precisión. Con Cohere Rerank, ya no tenemos que preocuparnos por eso y podemos centrarnos en otras partes como el recall.

Abhishek Modi, Ingeniero de Software, Notion
Entiende todo el contexto.

Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.

Historia completa

Notion opera a una escala que convierte la infraestructura de búsqueda en una preocupación central del producto, no en un detalle técnico. La plataforma aloja wikis colaborativas, sistemas de gestión de proyectos y bases de conocimiento conectadas para empresas que van desde pequeñas startups hasta grandes corporaciones globales, y a medida que esas organizaciones crecen, también lo hace el volumen de documentos, bases de datos e integraciones que gestionan en Notion. Cuando se lanzó Notion AI, ofrecer respuestas precisas y rápidas a las consultas de los usuarios en este heterogéneo conjunto de contenidos se convirtió en un requisito fundamental del producto. El desafío técnico consistía en encontrar una solución de reranking que pudiera igualar la precisión que los usuarios esperaban de las funciones nativas de IA.

Antes de integrar Cohere Rerank, el pipeline de búsqueda de Notion enfrentaba una tensión estructural: los modelos de embedding eran costosos de ejecutar a escala y requerían infraestructura de almacenamiento vectorial, pero los métodos de recuperación más sencillos carecían de la precisión necesaria para mostrar los documentos más relevantes en espacios de trabajo grandes. El desafío se veía agravado por la base de usuarios global de Notion, más de la mitad de los cuales trabajan con contenido multilingüe en los mercados de EMEA y APAC, lo que requería una solución que pudiera operar con precisión en varios idiomas sin necesidad de modelos separados ni sobrecarga técnica adicional.

Notion integró Cohere Rerank directamente en el pipeline de búsqueda, ubicándolo antes de que el modelo generativo procese cualquier consulta de usuario. La implementación utilizó Amazon SageMaker para el escalado automático, lo que permite a Notion gestionar cargas de tráfico variables sin sobreaprovisionamiento. Una decisión de diseño especialmente importante: para espacios de trabajo con menos de 1.000 documentos, que representan la mayoría de la base de clientes de Notion, Cohere Rerank permite saltarse por completo la búsqueda vectorial y por embeddings tradicional, reduciendo tanto el coste como la complejidad del sistema sin perder calidad en las respuestas. El mismo modelo Rerank también gestiona la combinación de resultados de múltiples fuentes, fusionando los resultados de Slack, GitHub y otras herramientas conectadas en respuestas coherentes y ordenadas por relevancia.

La mejora en precisión respecto a los modelos de embedding ha sido notable. Como explicó el ingeniero de software Abhishek Modi, Cohere Rerank es considerablemente más preciso que los enfoques de embedding para reducir grandes conjuntos de documentos al subconjunto más relevante, pasando de un pool de recuperación de 100.000 documentos a 200 con mucha mayor fidelidad. El cofundador y CTO Simon Last describió Rerank como esencial para lanzar rápidamente los AI Connectors de Notion, citando tanto la velocidad como la mejora continua como factores diferenciadores. El resultado: millones de usuarios de Notion han interactuado con las funciones de Notion AI, con un rápido crecimiento mensual en el uso y una contribución significativa a los ingresos de la empresa.

La implementación de Notion ilustra cómo una experiencia de IA de nivel consumidor depende de una infraestructura de recuperación de nivel empresarial por debajo. La decisión de asociarse estrechamente con Cohere, en lugar de depender de alternativas de código abierto que requerirían mantenimiento propio, refleja una apuesta estratégica por la mejora acelerada de los modelos y el soporte colaborativo como ventaja competitiva duradera a medida que Notion AI escala.

Casos similares

D
Draftwise
30%
improvement in search result quality

Draftwise, an AI-powered contract drafting and negotiation platform, built its Smart Draft product on Cohere’s Command, Embed, and Rerank models to enable semantic search and AI-generated contract language grounded in clients’ own document libraries. The system delivered a 30% improvement in search result quality and tripled API usage within a single quarter.

TechnologyCCCohere CommandCRCohere Rerank
B
BambooHR
tens of thousands
employee questions answered

BambooHR built an AI-powered HR assistant using Cohere's Embed and Rerank models to answer employee questions accurately, saving HR teams thousands of hours while handling sensitive data securely.

TechnologyCRCohere RerankCECohere Embed
A
Allspice
20% → 97%
ingredient matching accuracy

Allspice, a food technology startup building a kitchen operating system for consumers and recipe publishers, deployed Pinecone’s vector database to solve the inherent messiness of ingredient data that traditional text search could not handle. The implementation raised ingredient matching accuracy from roughly 20% to 97%, enabling the launch of recipe importing as a core product feature and expanding into a platform-wide semantic layer for search, recommendations, and conversational AI.

TechnologyTtext-embedding-3-largePPinecone
R
Rakuten
79%
reduction in average time to market for new features

Rakuten is a Japanese technology conglomerate operating over 70 businesses including e-commerce, fintech, travel, and communications, with thousands of developers serving millions of customers globally. The company deployed Claude Code and Claude Managed Agents as part of its “AI-nization” strategy, enabling autonomous multi-hour coding sessions and cross-functional agent workflows. Feature delivery time dropped 79%, from 24 working days to 5, while a seven-hour autonomous refactoring run on a 12.5-million-line codebase delivered 99.9% accuracy.

TechnologyCMClaude Managed AgentsCCClaude Code
S
Sommo
500–800
additional leads generated monthly

Sommo built an AI-powered SRS generator in Make in a single day, generating 500–800 additional leads per month and achieving a 5x increase in active website users.

TechnologyMMakeOOpenAI
C
Confluent
15,000+
hours saved monthly

Confluent, a data streaming platform company with 2,000+ employees and 4,000+ customers, deployed Glean to solve the knowledge fragmentation that came with rapid growth from 250 to 2,000+ employees across 20+ systems. Glean indexed the company's full tool stack — Slack, Salesforce, Confluence, and more — enabling instant knowledge retrieval across all teams. The result: 15,000+ hours saved monthly, a 13% increase in support team satisfaction, and over 70% employee adoption.

TechnologyGGlean
SA
System AI
97%
operation time reduction

System AI is an automation and web development consulting agency serving real estate businesses across the US, Australia, the UK, and Saudi Arabia. For client The Srama Group, System AI built a WhatsApp-based AI assistant using n8n that routes messages directly into Zoho CRM and Google Sheets, eliminating manual data entry by virtual assistants. The workflow reduced per-task operation time from four to five minutes down to 10–20 seconds — a 97% reduction — and helped the client win a buyers agency of the year award.

TechnologyNn8nZCZoho CRM
L
LTM
80%
candidate onboarding prediction accuracy

LTM, a global technology consulting and digital solutions company operating across India and international markets, deployed Snowflake’s AI Data Cloud to unify fragmented HR systems and power predictive hiring models. By migrating legacy on-premises data to Snowflake and deploying ML models via Snowpark and Cortex AI, LTM predicts candidate onboarding probability at 80% accuracy 25–30 days before start dates, cuts total cost of ownership by 70%, and processes hiring data 10x faster.

TechnologySSnowflakeSCSnowflake Cortex AI