Laut Beating hat Cognition Devin Fusion eingeführt, eine hybride KI-Agentenarchitektur, die darauf ausgelegt ist, die Leistung von Frontier-Modellen mit deutlich niedrigeren Kosten in Einklang zu bringen. Das System verwendet zwei Kernmechanismen: ein „Sidekick“-Design, bei dem kleinere, wirtschaftliche Modelle Code-Erkundungs-, Test- und Validierungsaufgaben übernehmen, während ein größeres Frontier-Modell die Planungs-, Anforderungsklärungs- und abschließende Prüfungsbefugnis behält, wobei jedes separate gecachte Kontexte unterhält, um teure Cache-Invalidierung zu vermeiden; und dynamisches Routing, das die Modelle während der Sitzungen basierend auf Aufgabenentwicklung und Kontextkomprimierung anpasst, wodurch „Zero-Cost“-Modell-Upgrades erreicht werden.
Tests mit dem FrontierCode-Benchmark zeigen, dass Devin Fusion die Entwicklungskosten für GPT-5.5- und Opus-4.8-Level-Modelle bei gleichbleibender Frontier-Leistung um durchschnittlich 35 % senkt, bzw. um bis zu 41 % bei Verwendung mit Fable 5. In der internen Entwicklung wurden 88 % der gemergten Pull Requests vollständig durch Fusions automatisches Routing gesteuert, obwohl die Leistung bei Aufgaben, die komplexe Entwicklungsabsichten und subjektives Urteilsvermögen erfordern, deutlich abfällt.