Auf den Punkt: Ein umgebungsfreier Patch-Verifikator ersetzt kostspielige Umgebungs-Setups durch intelligente Quellcode-Analyse und erreicht damit dieselbe Qualität beim Training von Coding-Agenten bei geringerem Overhead.

Forscher stellen Dockerless vor, einen Verifikator für Code-Patches, der ohne Docker-Container oder Umgebungsaufbau auskommt. Das System prüft generierte Code-Änderungen durch agentische Repository-Analyse statt durch Ausführung, reduziert damit Rechenkosten erheblich und erreicht beim Post-Training von Coding-Agenten vergleichbare Ergebnisse wie umgebungsbasierte Verfahren.

Dockerless wertet Code-Patches aus, ohne diese tatsächlich auszuführen. Standard-Verfahren setzen dafür Unit Tests in isolierten Umgebungen wie Docker-Images um – ein Setup-Prozess mit erheblichen Rechenkosten. Dockerless nutzt stattdessen ein agentengestütztes Verfahren: Der Verifikator erkundet das Repository systematisch, sammelt Kontextinformationen (etwa über Abhängigkeiten, Teststrukturen und bestehende Implementierungen) und bewertet die Korrektheit des Patches auf Basis dieser Evidenz.

In einer Benchmark-Evaluation übertrifft Dockerless den stärksten Open-Source-Verifikator um 14,3 AUC-Punkte. Das System lässt sich direkt in die Post-Training-Pipeline von Coding-Agenten integrieren: Es filtert Trainingstrajectories für Supervised Fine-Tuning (SFT) und erzeugt Reward-Signale für Reinforcement Learning (RL) – beides ohne Umgebungsaufbau.

Ein so trainiertes Modell erreicht auf etablierten Benchmarks Resolve-Raten von 62,0 % (SWE-bench Verified), 50,0 % (Multilingual) und 35,2 % (Pro) – damit übersteigt es den Qwen3.5-9B-Baseline um 2,4, 8,7 bzw. 2,9 Prozentpunkte. Diese Ergebnisse entsprechen denjenigen umgebungsbasierter Post-Training-Verfahren, während die Trainingsinfrastruktur deutlich schlanker wird.

Für Ingenieure bedeutet dies: Wenn Coding-Agenten in großem Maßstab trainiert oder evaluiert werden, kann Dockerless die Komplexität und den Ressourcenbedarf der Infrastruktur senken – ohne Trade-off bei der Modellqualität. Das Verfahren generalisiert auf verschiedene Programmiersprachen und Repository-Typen.

Quelle: arxiv.org · Erschienen 25. Juni 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.7.2.

Share on:

Dockerless: Code-Verifikation für KI-Agenten ohne Umgebungsaufbau

Lumi AI News

Rechtliches

Themenbereiche