TecnologíaIngeniería de Software

Cómo Cognition triplicó los pull requests aprobados por semana usando Claude para impulsar a Devin, su ingeniero de software con IA autónoma

Cognition es la empresa detrás de Devin, uno de los primeros ingenieros de software con IA, desplegado en empresas como Goldman Sachs, Mercedes-Benz y el Ejército de EE.UU. Devin gestiona tareas autónomas y de largo alcance en ingeniería de software — desde comprender tickets y localizar archivos relevantes hasta escribir, probar código y abrir pull requests. Cognition enruta su trabajo agéntico más exigente de contexto largo a Claude, que impulsa la capacidad de Devin para mantenerse en trayectoria en secuencias complejas y de varios pasos. Desde que adoptó Claude Sonnet 3.6, Cognition logró un aumento de 3,5× en los pull requests aprobados por semana.

Resultados

3.5×Aumento en pull requests aprobados por semana tras adoptar Claude Sonnet 3.6
Goldman Sachs, Mercedes-Benz, US ArmyClientes empresariales usando Devin

Herramientas y tecnologías

1C
Claude
Anthropic's AI assistant for analysis, writing, and reasoning tasks.

Categorías de IA

Desafío

La ingeniería de software autónoma con IA exige que un agente mantenga una ejecución coherente y de varios pasos en bases de código complejas sin desviarse — un requisito de consistencia que la mayoría de los modelos no cumplían, produciendo alta variabilidad y calidad degradada en contextos largos, lo que hacía demasiado arriesgado el despliegue autónomo en entornos empresariales.

Solución

Cognition enruta el trabajo agéntico de largo alcance más exigente de Devin a Claude, seleccionado por su rendimiento sostenido en contextos largos, el uso inteligente de herramientas en bases de código y la capacidad de expandir descripciones de tareas de dos líneas en trayectorias completas y precisas sin instrucciones totalmente especificadas.

Historia completa

Cognition launched Devin in early 2024 as one of the first AI software engineers — a product designed not to complete individual code suggestions but to take a well-scoped ticket and own the entire trajectory from understanding to shipped PR. The bar is categorically different from a code-completion tool. Users under-specify tasks by default; the agent has to clarify intent, infer context it wasn't given, and sustain focus across a long, multi-step sequence without drifting. A wrong starting inference doesn't just produce a bad line of code — it sends the entire trajectory off course.

Accede a 430+ casos de uso de IA, 415+ herramientas y rankings de señales de adopción.

Fuente

CLAUDE
junio de 2026
Caso de estudio original

Casos similares

1B
How Bubble Doubled User Activation and Lifted AI Satisfaction 30% with Claude
Bubble
2xFirst-week user activation rate
2DH
How Delivery Hero's Herogen Agent Merges 100+ Pull Requests a Day with Claude
Delivery Hero
>100Merged pull requests per day from Herogen
3M
How Mutiny Uses Claude to Give Every Sales Rep a Full Creative Team
Mutiny
3xImprovement in design satisfaction
4S
How Stairwell Uses Claude to Simplify Cybersecurity Threat Analysis
Stairwell
40,000+ charactersSecurity data processed per Claude request
5I
How Intuit Uses Claude to Build Tax Filing Confidence in TurboTax
Intuit
HigherHelpfulness rating vs. non-Claude experiences
6H
How HubSpot Uses Claude to Achieve 40% Productivity Gains Across Teams
HubSpot
Up to 40%Productivity increase across web development and content creation
7G
How Genspark Hit $250M ARR After Rebuilding Its Product Around a Claude-Powered Super Agent
Genspark
$250M+Annual recurring revenue reached after pivoting to the Super Agent
8E
How Emergent Reached $25M ARR Using Claude for Autonomous App Development
Emergent
$25M ARRAnnual recurring revenue after commercial launch
Ver todos los casos →