Zum Inhalt springen

OpenThoughts-Agent: Systematische Daten-Kurierung für Agentic-Modelle

Auf den Punkt: Eine systematische Daten-Kurierungs-Pipeline ermöglicht es, Agentic-Modelle über vielfältige Aufgabentypen generalisierbar zu trainieren und dabei konkurrenzfähige oder bessere Ergebnisse zu erzielen als spezialisierte Modelle.

Das OpenThoughts-Agent-Projekt veröffentlicht eine vollständig offene Datenkurations-Pipeline zur Schulung von Agentic-Language-Modellen. Ein Qwen3-32B-Modell erreicht damit 44,8 % durchschnittliche Genauigkeit über sieben Agentic-Benchmarks und übertrifft damit bestehende offene Ansätze.

Die Forschungsgruppe hinter OpenThoughts-Agent hat eine offene Datenkurations-Pipeline entwickelt, die gezielt Trainingsdaten für Agentic-Language-Modelle zusammenstellt. Die Arbeit adressiert eine bestehende Lücke: Während Projekte wie SWE-Smith, SERA und Nemotron-Terminal typischerweise auf einzelne Benchmarks spezialisiert sind, fehlte bislang eine Methodik, um Modelle zu trainieren, die über diverse agentic-Aufgaben hinweg generalisieren.

Das Forschungsteam führte über 100 kontrollierte Ablationsstudien durch, um jede Stufe der Pipeline systematisch zu untersuchen. Dabei identifizierten sie die Bedeutung von Aufgabenquellen und deren Vielfalt. Das finale Trainingsdataset besteht aus 100.000 Beispielen. Ein auf diesem Datensatz feinabgestimmtes Qwen3-32B-Modell erreichte eine durchschnittliche Genauigkeit von 44,8 % über sieben Agentic-Benchmarks — ein Vorteil von 3,9 Prozentpunkten gegenüber Nemotron-Terminal-32B (40,9 %), dem stärksten bestehenden offenen Agentic-Modell.

Die trainierten Modelle zeigen dabei starke Skalierungseigenschaften: Sie übertreffen alternative offene Datensätze bei jedem Trainingsgrößen-Niveau in rechengesteuerten Vergleichen. Das Projekt veröffentlicht die Trainingsdatensätze, die Data-Pipeline, experimentelle Daten und Modelle auf openthoughts.ai, um zukünftige offene Forschung auf diesem Gebiet zu unterstützen.


Quelle: arxiv.org · Erschienen 22. Juni 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.7.1.

Share on: