Ein 35B-Agentenmodell mit Horizon-Skalierung und Multi-Teacher-Destillation erreicht vergleichbare Leistung zu 1-Billionen-Parameter-Modellen auf Long-Horizon-Benchmarks.
Eine systematische Daten-Kurierungs-Pipeline ermöglicht es, Agentic-Modelle über vielfältige Aufgabentypen generalisierbar zu trainieren und dabei konkurrenzfähige oder bessere Ergebnisse zu erzielen als spezialisierte Modelle.