Ein neues Training-Paradigma ermöglicht es LLMs, In-Context-Wissen eigenständig in ihre Parameter zu integrieren und sich ohne menschliche Überwachung weiterzuentwickeln.
Ein 20B-Search-Agent erreicht 0,730 durchschnittliche Curated Recall über acht Benchmarks, indem RL auf explizitem Zustand trainiert wird statt Zustandsverwaltung in die Policy zu integrieren.
Die Übersetzung von Claudes internen Denkprozessen in natürliche Sprache bietet neue Transparenzpotenziale für künstliche Intelligenz und ermöglicht tiefere Einsichten in KI-Funktionsweisen.
Anthropic stellt Claude Opus 4.8 vor: Das verbesserte KI-Modell bietet besseres Urteilsvermögen, schnellere Verarbeitung und neue Funktionen wie Dynamic Workflows – bei gleichem Preis wie der Vorgänger. Early Tester berichten von deutlich höherer Zuverlässigkeit bei agentischen Aufgaben.