Cómo Cognition triplicó los pull requests aprobados por semana usando Claude para impulsar a Devin, su ingeniero de software con IA autónoma
Cognition es la empresa detrás de Devin, uno de los primeros ingenieros de software con IA, desplegado en empresas como Goldman Sachs, Mercedes-Benz y el Ejército de EE.UU. Devin gestiona tareas autónomas y de largo alcance en ingeniería de software — desde comprender tickets y localizar archivos relevantes hasta escribir, probar código y abrir pull requests. Cognition enruta su trabajo agéntico más exigente de contexto largo a Claude, que impulsa la capacidad de Devin para mantenerse en trayectoria en secuencias complejas y de varios pasos. Desde que adoptó Claude Sonnet 3.6, Cognition logró un aumento de 3,5× en los pull requests aprobados por semana.
Herramientas y tecnologías
1Categorías de IA
Desafío
La ingeniería de software autónoma con IA exige que un agente mantenga una ejecución coherente y de varios pasos en bases de código complejas sin desviarse — un requisito de consistencia que la mayoría de los modelos no cumplían, produciendo alta variabilidad y calidad degradada en contextos largos, lo que hacía demasiado arriesgado el despliegue autónomo en entornos empresariales.
Solución
Cognition enruta el trabajo agéntico de largo alcance más exigente de Devin a Claude, seleccionado por su rendimiento sostenido en contextos largos, el uso inteligente de herramientas en bases de código y la capacidad de expandir descripciones de tareas de dos líneas en trayectorias completas y precisas sin instrucciones totalmente especificadas.
Historia completa
Cognition launched Devin in early 2024 as one of the first AI software engineers — a product designed not to complete individual code suggestions but to take a well-scoped ticket and own the entire trajectory from understanding to shipped PR. The bar is categorically different from a code-completion tool. Users under-specify tasks by default; the agent has to clarify intent, infer context it wasn't given, and sustain focus across a long, multi-step sequence without drifting. A wrong starting inference doesn't just produce a bad line of code — it sends the entire trajectory off course.
Accede a 430+ casos de uso de IA, 415+ herramientas y rankings de señales de adopción.