Cómo GoGuardian usa Databricks para reducir los costos de ML un 90% mientras protege a los estudiantes de K–12

GoGuardian ofrece una plataforma integral de seguridad y aprendizaje utilizada por aproximadamente la mitad de los estudiantes de K–12 en EE. UU., procesando entre 4 y 6 mil millones de inferencias diarias para filtrar contenido nocivo y detectar comportamientos de riesgo. La compañía migró su infraestructura fragmentada de AWS a la plataforma Databricks Data Intelligence, unificando la gestión de datos, el desarrollo de ML y el despliegue de modelos en un entorno gobernado. La migración redujo los costos operativos de ML hasta un 90% en los modelos clave y disminuyó el uso inapropiado de dispositivos entre los estudiantes en un 62%.

Resultados

90%Ahorro en costos operativos del modelo Delphi
62%Reducción del uso inapropiado de dispositivos entre estudiantes
Up to 50%Reducción de costos operativos de ML en casos de uso clave
Over 95%Reducción de registros que requieren revisión humana de seguridad
18,623Estudiantes estimados protegidos de daños desde marzo de 2020

Herramientas y tecnologías

1
DL
Databricks Lakeflow
Databricks’ declarative pipeline framework for real-time data ingestion, transformation, and validation within the Data Intelligence Platform.
2
M
MLflow
Open-source ML lifecycle management platform for experiment tracking, model versioning, and reproducible deployment, developed and maintained by Databricks.
3
DM
Databricks Model Serving
Serverless model deployment service within the Databricks platform that enables real-time and batch inference at scale without manual infrastructure management.
4DS
Databricks SQL
Serverless SQL analytics engine built on the Databricks Lakehouse, delivering high-performance queries with elastic scaling and open data formats.
5D
dbt
SQL-based data transformation tool that builds and tests data models in warehouses via version-controlled code.
6DU
Databricks Unity Catalog
Unified governance layer for managing access, lineage, and quality of data and AI assets across a lakehouse.
7
DD
Databricks Delta Lake
Open-source storage layer that brings ACID transactions, scalable metadata handling, and unified streaming and batch data processing to data lakes.

Categorías de IA

Desafío

La infraestructura de AWS fragmentada y multi-servicio de GoGuardian no podía escalar de manera rentable a 4–6 mil millones de inferencias diarias de ML manteniendo el cumplimiento de COPPA y FERPA, y la gestión manual de clústeres generaba una carga operativa que ralentizaba los ciclos de desarrollo de IA.

Solución

GoGuardian migró a la plataforma Databricks Data Intelligence, utilizando Delta Lake para el almacenamiento fiable de datos, Databricks Lakeflow para la ingesta automatizada en tiempo real, cómputo sin servidor para escalar modelos bajo demanda, MLflow para la gestión del ciclo de vida, Databricks Model Serving para la inferencia en producción y Unity Catalog para la gobernanza unificada y el cumplimiento de privacidad.

Historia completa

GoGuardian se fundó con la convicción de que la tecnología, aplicada con criterio, puede proteger a los niños y apoyar a los educadores. Su plataforma sirve a aproximadamente la mitad de los estudiantes de K–12 en EE. UU., ejecutando alertas de prevención del suicidio, mitigación de distracciones y filtrado de contenido en millones de dispositivos inscritos. En el centro de esta misión se encuentra una operación intensiva en IA que procesa entre 4 y 6 mil millones de inferencias en un día escolar típico: clasificando sitios web, detectando intentos de eludir filtros y generando “Smart Alerts” para actividades de alto riesgo. La escala es enorme y también lo es la responsabilidad: los errores en la salida del modelo pueden significar advertencias perdidas sobre estudiantes en crisis.

Accede a 390+ casos de uso de IA, 392+ herramientas y rankings de señales de adopción.

Fuente

DATABRICKS
julio de 2025
Caso de estudio original

Casos similares

1
G
How Grammarly Serves 5 Billion Daily Events in 15 Minutes with Databricks
Grammarly
110% fasterQuery speed improvement vs prior data warehouse
2H
How HP Built a GenAI Data Chatbot in 3 Weeks Using Databricks Mosaic AI to Recover 20-30% of Data Team Time
HP
20-30%Cost savings vs AWS Redshift
3
O
How OpusClip Uses Claude Code to Build a GTM Intelligence Engine
OpusClip
100% automated (up from 5–10% manual)Sales call review coverage
4R
How Rakuten Uses Claude Managed Agents to Cut Release Cycles from Quarterly to Biweekly
Rakuten
From quarterly to every 2 weeksRelease frequency improvement
5S
How Sommo Uses Make and ChatGPT to Generate 800 Leads a Month
Sommo
500–800Additional leads generated monthly
6C
How Confluent Saves 15,000+ Hours a Month with Glean
Confluent
15,000+Hours saved monthly
7I
How IBM Uses watsonx to Unlock $4.5B in Productivity Gains
IBM
$4.5 billionTotal productivity gains unlocked
8F
How Fujitsu Built Takane, a Japanese LLM for Regulated Industries, with Cohere
Fujitsu
World-class scoreJGLUE benchmark performance
Ver todos los casos →