Anthropic fordert eine Luftfahrtaufsicht ähnliche Regulierungsbehörde oder beauftragte private Prüfer, um KI-Modelle vor ihrer Freigabe auf kritische Risiken zu untersuchen.
Das Benchmark-Framework Claw-SWE-Bench zeigt, dass Adapter-Design für Code-Agenten entscheidend ist: mit minimalem Adapter erreicht OpenClaw 19,1% Pass@1, mit vollständigem Adapter 73,4%.
Stormshield bringt mit der SNi50 eine OT-Firewall mit Netzwerkesegmentierung, Protokoll-Inspektion und VPN-Fernwartung auf den Markt, die hohe Verfügbarkeit und NIS2-Compliance für Kritische Infrastrukturen sicherstellen soll.
53 Prozent der Arbeitnehmer nutzen bereits private KI-Tools im beruflichen Kontext, weil die IT-Abteilungen keine genehmigten Alternativen bereitstellen.
InternVideo3 ermöglicht Foundation-Modellen, längere Videosequenzen mit iterativem Reasoning und Werkzeugnutzung zu analysieren, ohne dabei in Effizienzprobleme bei der KV-Cache-Verwaltung zu geraten.
Arbor ermöglicht KI-gesteuerte Forschung durch systematische Hypothesen-Verwaltung und erzielte auf sechs Testaufgaben durchschnittlich 2,5x höhere Verbesserungen als bestehende Code-Modelle.
Arbor koordiniert autonome KI-Agenten über persistente Hypothesenbäume und erzielte auf sechs Forschungsaufgaben 2,5-fach bessere Ergebnisse als Codex und Claude Code.
Bebop nutzt Rejection Sampling und TV-Loss-Optimierung, um MTP-Akzeptanzraten in RL-Training stabil zu halten und Rollouts um bis zu 1,8-fach zu beschleunigen.