Ein 20B-Search-Agent erreicht 0,730 durchschnittliche Curated Recall über acht Benchmarks, indem RL auf explizitem Zustand trainiert wird statt Zustandsverwaltung in die Policy zu integrieren.
PaW trainiert Umweltmodelle während des Policy-Trainings anhand derselben RL-Rollouts, was die Agent-Performance konsistent verbessert, ohne zusätzliche Simulatoren oder Inference-Kosten zu benötigen.
Edamame stellt Host-basierte Runtime-Verifikation vor, um Code-Drift und Missbrauch autonomer KI-Coding-Agenten zu erkennen, bevor vertrauliche Daten exfiltriert werden.
Hacker kaperten Instagram-Profile durch Prompt Injection gegen Metas KI-Support-System und überlisteten Deepfake-generierte Videos die automatisierte Identitätsprüfung.
Enterprise Security transformiert sich von statischen Breach-Annahmen zu KI-orchestrierten, hyper-segmentierten Verteidigungsmodellen mit dynamischen Zugriffskontrollrichtlinien.
Finanzbehörden verwenden echte Steuerdaten nicht nur zum KI-Training, sondern auch im laufenden Betrieb zur Validierung, was datenschutz- und AI-Act-Compliance erfordert.
Geometric Latent Reasoning approximiert diskrete Denkschritte als kontinuierliche Pfade im Embedding-Raum und erzielt damit kürzere Generierungen bei gleichbleibender oder besserer Genauigkeit.
Kleine persistente Adapter auf gemeinsamen Basismodellen können eine praktikable Infrastruktur für Millionen personalisierter KI-Modelle bilden, wenn Skalierung, Identitätsverwaltung und Serving-Anforderungen systematisch gelöst werden.