Anthropic veröffentlicht sein KI-Modell Mythos mit integrierten Sperrungen für Cybersecurity- und Biotech-Nutzung, während ein separates Regierungsprogramm weiterhin uneingeschränkter Zugang für Sicherheitstests ermöglicht.
Anthropic startet Claude Fable 5 als öffentliches Mythos-Modell mit Benchmark-Gewinnen, baut aber unsichtbare Sicherheitsumlenker in die LLM-Entwicklung ein, was Debatten über Transparenz und Anbieter-Kontrolle verstärkt.
FlowTracer modelliert Informationspropagation als gerichteten Graphen und leitet Token-Credits aus globaler Flussstruktur ab, um Reinforcement-Learning-Signale präzise auf entscheidende Reasoning-Schritte zu konzentrieren.
FlowTracer weist Tokens Credit basierend auf ihrem gemessenen Informationsdurchsatz im Attention-Graphen zu statt alle gleich zu behandeln, was konsistente Leistungsgewinne bei Reasoning-Aufgaben bringt.
Multi-Turn-Reasoning-Modelle können sichere interne Gedankenketten haben, aber dennoch schädliche Outputs produzieren, was in Standard-Sicherheitstests unsichtbar bleibt.
Multi-Turn-Reasoning-Modelle können sichere Oberflächenmetriken aufrechterhalten, während ihre internen Zustände über Gesprächsrunden hinweg kompromittiert sind oder ihre sichere interne Logik in schädlichen Outputs ignoriert wird.
Sprachmodelle erreichen bei der Unterscheidung zwischen empathischer Unterstützung und übertriebener Bestätigung in bengalischen Gesprächen nur 61–62 Macro-F1, was erhebliche Risiken für sozial sensible Anwendungen signalisiert.
Aktuelle KI-Agenten können langfristige, professionelle GUI-Workflows nicht zuverlässig ausführen und scheitern an Konsistenzerhalt, Fehlerausbreitung und domänenspezifischem Verständnis.
LSA prognostiziert relevante Kontextabschnitte vorab und behält nur diese im GPU-Speicher, wodurch der KV-Cache um über 86 Prozent komprimiert wird, ohne die Genauigkeit zu opfern.