STARE: Token-Level Stabilitätsverfahren gegen Policy-Entropie-Kollaps in GRPO-Training

18. June 202619. June 2026
AI Models, Claude AI

STARE nutzt Überraschungsmetriken und selektive Advantage-Reweighting, um Policy-Entropie über lange Trainingssequenzen stabil zu halten und dabei Genauigkeit um 4–8 % zu verbessern.

Share on:

GLM-5.2: Chinesisches Open-Weights-Modell mit 753 Milliarden Parametern

18. June 202618. June 2026
AI Models, Claude Code

GLM-5.2 rangiert als führendes offenes Sprachmodell auf dem Artificial-Analysis-Index mit einem Score von 51 und belegt Platz 2 im Code-Arena-WebDev-Leaderboard, produziert aber signifikant mehr Output-Tokens als Konkurrenzmodelle.

Share on:

ProCUA-SFT: Automatisch generierte Trainingsdaten für Desktop-Agenten

17. June 202617. June 2026
AI Models, Claude Code

Automatisch synthetisierte Trainingsdaten verbessern Desktop-Agenten um 18,7 Prozentpunkte gegenüber bisherigen Ansätzen.

Share on:

ZPPO: Lehrermodelle als Prompts statt als Gradienten

17. June 202617. June 2026
AI Models, Claude AI

ZPPO integriert Lehrermodelle als Prompt-Komponenten statt als Gradienten und verbessert damit die Generalisierung beim Wissenstransfer auf kleine Modelle.

Share on:

Amazon Bedrock: InvokeGuardrailChecks API für agentenbasierte Anwendungen

16. June 202617. June 2026
AI Models, Claude Code

Die neue API ermöglicht es, Safeguards granular an jedem Punkt in Multi-Turn-Agent-Schleifen anzuwenden und basierend auf numerischen Scores eigene Schwellwerte sowie Aktionen (Block, Bypass, Retry) zu definieren.

Share on:

P-EAGLE: Parallele Spekulation für schnellere LLM-Inferenz auf AWS SageMaker

16. June 202616. June 2026
AI Models, Claude Code

AWS hat mit P-EAGLE eine parallelisierte Variante von Speculative Decoding entwickelt, die Draft-Tokens in einem Forward-Pass statt sequenziell erzeugt und damit Inferenzdurchsatz auf SageMaker AI um bis zu 1,69x erhöht.

Share on:

Tangram: statische KV-Cache-Kompression für schnelleres Multi-Turn-LLM-Serving

16. June 202616. June 2026
AI Models, Claude Code

Tangram statisch vorhersagbare Speicherbudgets pro Attention-Head, um Fragmentierung und Latenzverschleppung zu eliminieren, die dynamische KV-Cache-Kompression verursacht.

Share on:

FastContext: Spezialisierte Agenten für effiziente Code-Repository-Erkundung

16. June 202616. June 2026
AI Models, Claude Code

Dedizierte Explorations-Modelle (4B–30B Parameter) können Code-Suche in Repositories effizienter handhaben als allgemeine Solver-Modelle und reduzieren dabei Context-Pollution erheblich.

Share on:

HarnessX: Automatisierte Optimierung von Agent-Laufzeitumgebungen

15. June 202615. June 2026
AI Models, Claude AI, Claude Code

HarnessX automatisiert Zusammenbau und Anpassung von Agent-Harnesses aus Ausführungsspuren und erreicht durchschnittlich +14,5 % Leistungssteigerung ohne Modellskalierung.

Share on:

Agent-EvalKit: Open-Source-Evaluierung für KI-Agenten in Claude Code

11. June 202611. June 2026
AI Models, Claude AI, Claude Code

Agent-EvalKit automatisiert die Evaluierung von KI-Agenten durch strukturierte Test-Case-Generierung, Observability-Instrumentierung und kombinierte Code- sowie LLM-basierte Metriken direkt in der Entwicklungsumgebung.

Share on:

Mixture-of-Experts Router durch Manifold Power Iteration optimiert

11. June 202611. June 2026
AI Models, Claude Code

Die Ausrichtung von Router-Zeilen an den mathematischen Hauptrichtungen ihrer zugeordneten Expert-Matrizen verbessert die Effizienz und Stabilität von Mixture-of-Experts-Modellen.

Share on:

Claw-SWE-Bench: Benchmark für KI-Agenten bei Code-Aufgaben

11. June 202611. June 2026
AI Models, Claude Code

Das Benchmark-Framework Claw-SWE-Bench zeigt, dass Adapter-Design für Code-Agenten entscheidend ist: mit minimalem Adapter erreicht OpenClaw 19,1% Pass@1, mit vollständigem Adapter 73,4%.

Share on:

« Previous
1
2
3
4
5
…
38
Next »

STARE: Token-Level Stabilitätsverfahren gegen Policy-Entropie-Kollaps in GRPO-Training

GLM-5.2: Chinesisches Open-Weights-Modell mit 753 Milliarden Parametern

ProCUA-SFT: Automatisch generierte Trainingsdaten für Desktop-Agenten

ZPPO: Lehrermodelle als Prompts statt als Gradienten

Amazon Bedrock: InvokeGuardrailChecks API für agentenbasierte Anwendungen

P-EAGLE: Parallele Spekulation für schnellere LLM-Inferenz auf AWS SageMaker

Tangram: statische KV-Cache-Kompression für schnelleres Multi-Turn-LLM-Serving

FastContext: Spezialisierte Agenten für effiziente Code-Repository-Erkundung

HarnessX: Automatisierte Optimierung von Agent-Laufzeitumgebungen

Agent-EvalKit: Open-Source-Evaluierung für KI-Agenten in Claude Code

Mixture-of-Experts Router durch Manifold Power Iteration optimiert

Claw-SWE-Bench: Benchmark für KI-Agenten bei Code-Aufgaben

Lumi AI News

Rechtliches

Themenbereiche