Cómo Recursion y el MIT Construyeron Boltz-2 para Reducir el Trabajo de Laboratorio en Descubrimiento de Fármacos un 40% con NVIDIA
Recursion y el Jameel Clinic del MIT se asociaron para desarrollar Boltz-2, un modelo fundacional biomolecular de código abierto entrenado en el superordenador BioHive-2 de NVIDIA que predice simultáneamente estructuras de complejos proteicos y afinidades de unión. El modelo quedó primero en los datos de afinidad de CASP16, procesa resultados en ~20 segundos de GPU por par ligando-proteína y logra hasta 3x de aceleración de inferencia mediante NVIDIA NIM — permitiendo a los equipos de descubrimiento de fármacos obtener el 80% del valor experimental con un 40% menos de trabajo de laboratorio.
Impacto
40%
Reducción del trabajo de laboratorio para valor equivalente
2x–3x
Aceleración de inferencia con NVIDIA NIM
up to 5x
Aceleración de operaciones triangulares con cuEquivariance
~20 GPU-seconds
Tiempo de procesamiento por par ligando-proteína
1st
Clasificación en el benchmark de afinidad CASP16
Desafío
La predicción de estructuras proteína-ligando y la estimación de afinidad de unión requerían pipelines computacionales separados, con métodos físicos de afinidad tardando semanas por cada gran biblioteca de compuestos — creando un cuello de botella de rendimiento fundamental que obligaba a los equipos de descubrimiento de fármacos a depender fuertemente de costosos experimentos de laboratorio para el filtrado de candidatos.
Solución
Recursion y el Jameel Clinic del MIT entrenaron Boltz-2 en el superordenador BioHive-2 de NVIDIA, creando un modelo fundacional de código abierto que unifica el co-plegamiento y la predicción de afinidad de unión con operaciones de geometría aceleradas por cuEquivariance y despliegue mediante NVIDIA NIM, procesando pares ligando-proteína en ~20 segundos de GPU con hasta 3x de aceleración de inferencia.
Herramientas y tecnologías
Lo que dicen los líderes
“Con IA en el bucle hoy, podemos obtener el 80% del valor con el 40% del trabajo de laboratorio.”
Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.
Historia completa
Recursion es una empresa biotecnológica estadounidense que aplica métodos computacionales e IA al descubrimiento de fármacos, operando en la intersección del aprendizaje automático y la biología experimental. El Jameel Clinic y el Laboratorio de Informática e Inteligencia Artificial (CSAIL) del MIT son socios de investigación centrados en la aplicación de la IA a la medicina. Su colaboración se dirigió a uno de los cuellos de botella fundamentales en el descubrimiento de fármacos guiado por estructura: el hecho de que predecir las estructuras de unión proteína-ligando y estimar las afinidades de unión ha requerido históricamente pipelines computacionales separados, cada uno consumiendo un tiempo de GPU considerable y recursos de validación en laboratorio.
Los métodos físicos para la estimación de afinidad de unión tardaban tradicionalmente semanas en procesar grandes bibliotecas de compuestos. El coste computacional de ejecutar estas predicciones a la escala requerida para los programas modernos de cribado de fármacos creaba una restricción de rendimiento fundamental: los equipos solo podían evaluar una fracción de los compuestos candidatos en el tiempo disponible, dependiendo fuertemente de costosos y lentos experimentos de laboratorio para validar predicciones que deberían haber sido pre-filtradas computacionalmente.
Trabajando en el superordenador BioHive-2 de NVIDIA — un sistema DGX SuperPOD con 63 nodos DGX H100 — el MIT y Recursion entrenaron Boltz-2, un modelo fundacional de código abierto que unificó el co-plegamiento de complejos proteicos y la predicción de afinidad de unión en una única arquitectura. Los núcleos cuEquivariance de NVIDIA aceleraron las operaciones equivariantes personalizadas necesarias para el modelado preciso de geometría molecular, logrando hasta 5x de aceleración en operaciones triangulares frente a implementaciones estándar. El empaquetado NVIDIA NIM permite el despliegue en producción de Boltz-2 como microservicio empresarial con 2x–3x de aceleración de inferencia, y el modelo está disponible como Boltz-2 NIM para equipos que despliegan a escala.
Los resultados validaron el enfoque en múltiples benchmarks. Boltz-2 quedó primero en los datos de predicción de afinidad de CASP16. Alcanza una correlación de Pearson de 0,62–0,66 en las predicciones de afinidad y procesa pares ligando-proteína individuales en aproximadamente 20 segundos de GPU en un A100. A nivel de aplicación, la transformación operativa es significativa: como describió Ben Mabey, CTO de Recursion: «Con IA en el bucle hoy, podemos obtener el 80% del valor con el 40% del trabajo de laboratorio». Esa proporción — calidad de predicción mantenida reduciendo sustancialmente la carga experimental — es la métrica que importa para los pipelines de descubrimiento de fármacos que operan bajo presión de tiempo y costes.
Boltz-2 es de código abierto y está disponible para su adopción generalizada en la comunidad de descubrimiento de fármacos. Su combinación de predicción de estructura y estimación de afinidad en un único modelo, entrenado en un clúster de supercomputación específico y empaquetado para despliegue empresarial mediante NVIDIA NIM, establece una nueva referencia para lo que puede ofrecer la infraestructura computacional de descubrimiento de fármacos antes de que comiencen los experimentos de laboratorio.