KVarN reduziert durch verbesserte Token-Scale-Normalisierung die Fehlerakkumulation beim Quantisieren von KV-Caches auf 2-Bit-Genauigkeit und erreicht State-of-the-Art-Ergebnisse auf MATH500, AIME24 und HumanEval.
OpenAI fordert verbindliche Evaluierungen von KI-Modellen durch das Handelsdepartement statt durch Geheimdienste und setzt dabei auf bereits etablierte Beziehungen zu führenden Laboren.
Apple setzt die neue Siri-Generation in iOS 27 auf Googles Gemini-Modelle um und nutzt Google Cloud für komplexe KI-Anfragen, weil die eigene Private-Cloud-Compute-Infrastruktur nicht skalierbar genug ist.
Gemma 4 12B läuft auf Standard-Laptops mit 16 GB RAM und ermöglicht über die LiteRT-LM CLI lokale API-Endpunkte für agentengesteuerte Workflows ohne Cloud-Abhängigkeit.
Mit SFT und DPO lässt sich die Werkzeugwahl von Language Models zielgerichtet trainieren, ohne dass eigene Trainingsinfrastruktur verwaltet werden muss.
NVIDIA automatisiert Workflows in der Physical-AI-Forschung durch neue Agent Skills, die Szenenrekonstruktion, Datengeneration und Policy-Training für autonome Fahrzeuge, Robotik und Vision-AI skalierbar machen.
Die EU schafft ein vierstufiges Sicherheitsklassifizierungssystem für Cloud- und KI-Dienste, das europäische Anbieter begünstigt und große US-amerikanische Konzerne strukturell benachteiligt.