Cómo Scribd Redujo los Costes de IA Generativa un 90 % y Aumentó Registros con Databricks
Scribd, Inc. opera tres marcas de contenido —Scribd, SlideShare y Everand— y gestiona una biblioteca global de más de 250 millones de documentos, audiolibros y libros electrónicos. Tras fragmentar su desarrollo de IA en múltiples herramientas desconectadas, la empresa se consolidó en la plataforma Databricks Data Intelligence para gestionar todo el ciclo de vida de datos e IA en un único entorno. El resultado: una reducción del 90 % en los costes de IA generativa, un aumento del 7 % en nuevos registros de usuarios y la capacidad de pasar de prototipo a producción en semanas en lugar de meses.
Herramientas y tecnologías
1Categorías de IA
Desafío
La infraestructura de datos de Scribd estaba fragmentada en herramientas separadas para ETL, experimentación con LLM y servicio de modelos, creando ciclos de retroalimentación lentos entre los científicos de datos y los equipos de producción y dificultando enormemente la puesta en producción de la IA de forma eficiente.
Solución
Scribd se consolidó en la plataforma Databricks Data Intelligence, utilizando Databricks Notebooks, el servicio de modelos Mosaic AI, Delta Lake, Unity Catalog y Lakeflow Jobs para gestionar todo el ciclo de vida de datos e IA en un único entorno, lo que le permitió pasar de prototipo a producción en semanas y reducir los costes operativos de IA generativa en un 90 %.
Historia completa
Scribd, Inc. conecta a millones de usuarios con el conocimiento a través de tres plataformas diferenciadas: Scribd, una biblioteca impulsada por los usuarios; SlideShare, un repositorio de presentaciones; y Everand, un servicio de suscripción de audiolibros y libros electrónicos. La biblioteca de contenidos de la empresa ha crecido hasta superar los 250 millones de piezas —multilingüe, con contenido multimedia variado y de formatos muy distintos—. A esa escala, garantizar que el contenido sea localizable, esté correctamente etiquetado y esté libre de material de baja calidad no es una tarea que pueda hacerse manualmente.
Accede a 390+ casos de uso de IA, 392+ herramientas y rankings de señales de adopción.