Während Level 1 und 2 heute weit verbreitet sind, bringt erst Level 3 die überragende Steigerung an Produktivität bei technischen Migrationen. Die Modelle haben dafür den nötigen Reifegrad erreicht, das belegen etablierte Benchmarks wie METR, SWE-bench und τ-bench.
Dass Level 3 bislang trotzdem nur bei den "Early Adopters" verbreitet ist, hat einen einfachen Grund: Es setzt eine Systemumgebung voraus, in der die Agenten weitgehend autonom und trotzdem kontrolliert arbeiten können. Diese Systemumgebung einzurichten und zu erhalten ist, besonders in stark regulierten Umfeldern, eine komplexe Engineering-Aufgabe.
Es lohnt sich, in diese Engineering-Herausforderungen zu investieren. Erst Level 3 ist der "sweet spot" für technische Migrationen, weil darin rund 80% der Projektzeit auf reine Umsetzung entfallen und damit auf den Task, den Agentic Coding massiv beschleunigt. Außerdem sind hier, anders als bei Greenfield-Projekten, Soll-Architektur und Zielzustand dokumentierbar, Regeln lassen sich formalisieren und Ergebnisse automatisiert überprüfen. Das sind die Bedingungen, unter denen Agenten ihre Stärken voll ausspielen.