TecnologíaIngeniería de Software

Cómo Canva utiliza W&B Registry para optimizar el despliegue de modelos de ML

CCanvaFuente: WEIGHTSdiciembre de 2025

Canva, la plataforma de diseño con más de 150 millones de usuarios activos mensuales, construyó un equipo de más de 100 ingenieros de machine learning cuyos flujos de trabajo de despliegue estaban sobrecargados por una gestión ruidosa de artefactos y una lógica de etiquetado compleja. La empresa adoptó Weights & Biases Registry como centro de referencia para separar los modelos experimentales de los que están listos para producción, eliminando la fricción en el despliegue y proporcionando a todo el equipo de ML una única fuente de verdad. El cambio creó un límite claro entre la experimentación y la producción que el equipo afirma que transformó fundamentalmente cómo funciona el despliegue de ML en Canva.

Impacto

100+

Ingenieros de ML en el equipo

150M+

Usuarios activos mensuales en la plataforma Canva

Desafío

Los más de 100 ingenieros de ML de Canva no contaban con una separación clara entre modelos experimentales y de producción, lo que obligaba a usar una lógica de etiquetado compleja para determinar qué artefactos estaban listos para el despliegue, generando ruido y fricción en todo el ciclo de vida del ML.

Solución

Weights & Biases Registry se desplegó como centro de referencia para los modelos listos para producción, utilizando un modelo de promoción limpio y aliases para separar la experimentación del despliegue. El Registry se integra con Anyscale, Nix y Amazon ECS para conformar un flujo de trabajo de ML coherente de extremo a extremo.

Herramientas y tecnologías

Lo que dicen los líderes

El W&B Registry simplifica nuestras vidas de muchas maneras. Reduce el ruido en la experiencia del usuario, ya que ahora solo vemos los modelos que están listos para producción. Almacena toda la información de nivel de producción que necesitamos.

Thibault Main de Boissiere, Responsable del Equipo de Plataforma de ML, Canva

Todos nuestros MLEs y algunos gestores de producto tienen acceso a Weights & Biases. Nos encanta la interfaz de W&B; todo lo que viene de serie es realmente útil con métricas del sistema muy prácticas, y es fácil gestionar el acceso y la seguridad en el lado de administración.

Thibault Main de Boissiere, Responsable del Equipo de Plataforma de ML, Canva
Entiende todo el contexto.

Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.

Historia completa

Canva ha evolucionado de ser una herramienta de diseño para consumidores a convertirse en una de las plataformas creativas más utilizadas del mundo, con más de 150 millones de usuarios activos mensuales y reconocida habitualmente entre las empresas más innovadoras en software empresarial. Detrás del producto, un equipo de más de 100 ingenieros de machine learning trabaja en todo, desde modelos generativos y sistemas de recomendación hasta algoritmos de personalización y mejora de la búsqueda. Gestionar ese volumen de trabajo de ML de forma ordenada —desde el experimento hasta la producción— se convirtió en uno de los principales retos de infraestructura del equipo.

Antes de adoptar W&B Registry, el equipo de ML de Canva no tenía un límite arquitectónico claro entre las ejecuciones de entrenamiento experimentales y los modelos listos para producción. Todo convivía en el mismo espacio de artefactos, y determinar qué modelo debía desplegarse requería interpretar una combinación compleja de etiquetas. Para un equipo de más de 100 ingenieros trabajando con múltiples tipos de modelos, esto generaba ruido constante: era fácil perder de vista qué artefacto estaba listo para producción y cuál seguía en experimentación. Como resultado, el proceso de despliegue era lento y propenso a errores.

El responsable del equipo de plataforma de ML, Thibault Main de Boissiere, y su equipo implementaron Weights & Biases Registry como eje central de un flujo de trabajo reestructurado. El Registry se sitúa en el centro del stack de ML de Canva, actuando como punto de transición entre la experimentación y el despliegue. Las ejecuciones experimentales rastreadas en W&B permanecen en la capa de seguimiento de experimentos; solo los modelos listos para producción se promueven al Registry, donde los alias dejan claro sin ambigüedad qué artefacto está destinado al despliegue o a las pruebas A/B. El stack más amplio conecta el Registry con Anyscale para notebooks bajo demanda y entrenamiento distribuido, Nix para la gestión de dependencias, y Amazon ECS para el despliegue en producción.

El impacto fue una claridad inmediata. Los ingenieros del equipo —incluidos los gestores de producto que también tienen acceso a W&B— ahora solo ven modelos listos para producción en el Registry. La complejidad de etiquetado que anteriormente dictaba las decisiones de despliegue fue sustituida por un modelo de promoción limpio. Como describe Thibault, el Registry “simplifica nuestras vidas de muchas maneras” al eliminar el ruido y almacenar toda la información de nivel de producción en un solo lugar. El equipo también elogió la interfaz de W&B en general, destacando las métricas de sistema útiles y la facilidad de gestión de accesos y seguridad como cualidades que facilitaron la operación de la plataforma a escala de equipo.

El equipo de Canva considera el Registry como algo más que un problema resuelto: es una plataforma que planean ampliar más adelante. Thibault describió la ambición de utilizar el Registry para transformar cómo funciona el despliegue de ML en toda la organización, posicionándolo como una palanca clave para evolucionar desde un proceso de despliegue reactivo hacia un pipeline de producción deliberado y gobernado. Para una empresa que invierte tan fuertemente en IA como Canva, contar con esa base es fundamental a medida que la superficie de modelos sigue expandiéndose.

Casos similares

A
Allspice
20% → 97%
ingredient matching accuracy

Allspice, a food technology startup building a kitchen operating system for consumers and recipe publishers, deployed Pinecone’s vector database to solve the inherent messiness of ingredient data that traditional text search could not handle. The implementation raised ingredient matching accuracy from roughly 20% to 97%, enabling the launch of recipe importing as a core product feature and expanding into a platform-wide semantic layer for search, recommendations, and conversational AI.

TechnologyTtext-embedding-3-largePPinecone
S
Sommo
500–800
additional leads generated monthly

Sommo built an AI-powered SRS generator in Make in a single day, generating 500–800 additional leads per month and achieving a 5x increase in active website users.

TechnologyMMakeOOpenAI
C
Confluent
15,000+
hours saved monthly

Confluent, a data streaming platform company with 2,000+ employees and 4,000+ customers, deployed Glean to solve the knowledge fragmentation that came with rapid growth from 250 to 2,000+ employees across 20+ systems. Glean indexed the company's full tool stack — Slack, Salesforce, Confluence, and more — enabling instant knowledge retrieval across all teams. The result: 15,000+ hours saved monthly, a 13% increase in support team satisfaction, and over 70% employee adoption.

TechnologyGGlean
H
Headstart
90–97%
code written by claude

Headstart, an AI-native software studio, uses Claude 3.5 Sonnet to write 90-97% of client code, compressing enterprise software project timelines from months to weeks and delivering 10-100x development speed.

TechnologyC3Claude 3.5 Sonnet
M
Motive
2,000+
ai agents deployed

Motive, an AI platform for physical operations serving nearly 100,000 customers, deployed Glean across its workforce to democratize enterprise AI through unified search and agentic workflows. The company has deployed over 2,000 AI agents, cut account planning time by 75%, and reports thousands of hours saved per week across teams.

TechnologyGGleanGAGlean Agent Builder
L
LTM
80%
candidate onboarding prediction accuracy

LTM, a global technology consulting and digital solutions company operating across India and international markets, deployed Snowflake’s AI Data Cloud to unify fragmented HR systems and power predictive hiring models. By migrating legacy on-premises data to Snowflake and deploying ML models via Snowpark and Cortex AI, LTM predicts candidate onboarding probability at 80% accuracy 25–30 days before start dates, cuts total cost of ownership by 70%, and processes hiring data 10x faster.

TechnologySSnowflakeSCSnowflake Cortex AI
N
Nextdoor
2–3x
engineering productivity improvement

Nextdoor, the neighborhood social network, deployed Glean as a unified Work AI layer embedded directly into the tools employees already use. Rather than mandating adoption, the team built a self-reinforcing learning loop of Slack channels, live office hours, and quick-win storytelling that turned early experimentation into company-wide AI habits — with engineering productivity gains of 2–3x and RevOps workflows shrinking from hours to minutes.

TechnologyGGlean
E
Ensono
54–70%
reduction in mean time to resolution (mttr)

Ensono, a managed services provider handling over 60 billion retail transactions and government platforms for 24 million constituents, built two AI-powered systems on Snowflake to shift IT operations from reactive to predictive. The Envision Predictive Engine (EPE) and DiagnoseNow application reduced mean time to resolution by 54–70%, cut major incidents by 22%, and improved SLA performance by 38% across its enterprise client base.

TechnologySMSnowpark MLSSnowflake