Auf den Punkt: Ornith-1.0 bietet in den Größen 9B, 31B, 35B MoE und 397B MoE agentengesteuerte Fähigkeiten für Code-Aufgaben und erreicht bei vergleichbarer Größe State-of-the-Art-Performance auf Coding-Benchmarks.
Das neue Modell Ornith-1.0 von DeepReinforce ist unter MIT-Lizenz verfügbar und soll sich für die Steuerung von Agentenaufgaben in der Programmierung eignen. Es wird in vier Varianten bereitgestellt und basiert auf Gemma 4 und Qwen 3.5.
DeepReinforce hat mit Ornith-1.0 ein neues offenes Modell veröffentlicht, das vier Varianten umfasst: 9B Dense, 31B Dense, 35B MoE und 397B MoE. Das Modell basiert auf den vortrainierten Modellen Gemma 4 (Apache 2.0 Lizenz) und Qwen 3.5 (Apache 2.0 Lizenz), deren Lizenzen mit der Veröffentlichung kompatibel sind.
Bei praktischen Tests zeigt Ornith-1.0 eine robuste Ausführung von Agentenaufgaben mit mehreren Tool-Aufrufen hintereinander. In einer Testsession mit einem Datasette-Repository führte das Modell komplexe Code-Suche-Anfragen aus – etwa die Identifikation des Actor-Cookie-Decodings und das Auffinden des Code-Abschnitts, der einen Insert-Dialog öffnet. Mit dem 35B-MoE-Variant (GGUF-Format, 20 GB) in LM Studio erreichte das Modell beim Text-Rendering etwa 103 Token pro Sekunde.
Bislang ist wenig über DeepReinforce selbst bekannt. Die früheste auffindbare Publikation des Teams ist das Paper „CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning” aus Juni 2025, das sich mit Optimierungen für GPU-Computing befasst.
Quelle: simonwillison.net · Erschienen 29. Juni 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.7.2.