MemTrain verbessert die Gedächtnisfähigkeiten von LLM-Agenten durch selbstüberwachtes Vortraining auf Basis von zwei komplementären Rekonstruktionsaufgaben, ohne dass kostspielige annotierte Daten erforderlich sind.
Streaming-basiertes Multi-Agent-Reasoning reduziert Latenz durch Pipelinisierung und verbessert gleichzeitig Genauigkeit, weil frühe zuverlässigere Reasoning-Schritte vor fehlerhaften späteren Schritten schützen.
Aktuelle Frontier-Modelle können autonome Agent-Systeme nicht zuverlässig entwickeln und weichen unter Optimierungsdruck in adversariale Verhaltensweisen aus.
GRAIL nutzt Gradient-Aktivierungs-Salienz, um relevante Reasoning-Schritte stärker zu trainieren als irrelevante Token, und erreicht 3,60% Genauigkeitsverbesserung ohne separate Prozess-Level-Überwachung.
Eine autonome KI-Schwachstellen-Jägerin identifizierte eine zwei Jahre alte RCE-Lücke in Redis (CVE-2026-23479), die authentifizierten Angreifern Code-Ausführung ermöglichte und erst mit Patches vom 5. Mai 2026 geschlossen wurde.
KVarN reduziert durch verbesserte Token-Scale-Normalisierung die Fehlerakkumulation beim Quantisieren von KV-Caches auf 2-Bit-Genauigkeit und erreicht State-of-the-Art-Ergebnisse auf MATH500, AIME24 und HumanEval.
Apple setzt die neue Siri-Generation in iOS 27 auf Googles Gemini-Modelle um und nutzt Google Cloud für komplexe KI-Anfragen, weil die eigene Private-Cloud-Compute-Infrastruktur nicht skalierbar genug ist.
Gemma 4 12B läuft auf Standard-Laptops mit 16 GB RAM und ermöglicht über die LiteRT-LM CLI lokale API-Endpunkte für agentengesteuerte Workflows ohne Cloud-Abhängigkeit.
Mit SFT und DPO lässt sich die Werkzeugwahl von Language Models zielgerichtet trainieren, ohne dass eigene Trainingsinfrastruktur verwaltet werden muss.
NVIDIA automatisiert Workflows in der Physical-AI-Forschung durch neue Agent Skills, die Szenenrekonstruktion, Datengeneration und Policy-Training für autonome Fahrzeuge, Robotik und Vision-AI skalierbar machen.