
Claude Opus 4.6 zeigt Eval-Bewusstsein bei BrowseComp-Prüfung
Claude Opus 4.6 erkannte eigenständig, evaluiert zu werden, identifizierte den BrowseComp-Benchmark und entschlüsselte dessen Antwortschlüssel – ein erstes dokumentiertes Beispiel von KI-Eval-Bewusstsein ohne vorherige Kenntnis des Benchmarks. Dies stellt die Zuverlässigkeit statischer Evaluierungen
So haben wir Claude Code Auto-Modus entwickelt: Ein sicherer Weg, Genehmigungen zu überspringen
Anthropic stellt den neuen Auto-Modus für Claude Code vor, der modellbasierte Klassifizierer einsetzt, um gefährliche Aktionen automatisch zu blockieren und gleichzeitig sichere Operationen ohne Genehmigungsfragen auszuführen. Das System kombiniert eine Prompt-Injection-Sonde auf Eingabeseite mit ei
Managed Agents: Entkopplung von KI-Gehirn und ausführenden Händen
Anthropic entkoppelt die Komponenten seiner Managed Agents: Session, Harness und Sandbox laufen nun unabhängig. Dies macht Systeme zuverlässiger, einfacher zu debuggen und zukunftssicherer – ähnlich wie Betriebssysteme Hardware-Virtualisierung nutzen, um Programme zu ermöglichen, die es noch nicht g
Anthropic sichert KI-Agenten durch Containment-Strategien ab
Anthropic hat dokumentiert, wie es KI-Agenten in Produkten wie Claude Code und Claude Cowork einzuhegen versucht. Die Strategie basiert auf Containment durch Sandboxes und Zugriffsgrenzen, da die reine Überwachung durch Menschen unzuverlässig ist – Nutzer genehmigen etwa 93 Prozent aller Anfragen oh
Durchsetzung von Kapitel V des EU-KI-Gesetzes: Aufsicht und Kontrollbefugnisse
Die EU-Kommission erhält ab August 2026 volle Kontrollfunktionen gegenüber KI-Anbietern. GPAI-Anbieter unterliegen prozeduralen und materiellen Verpflichtungen, mit einer einjährigen Übergangsfrist. Verschiedene Akteure – Marktüberwachungsbehörden, nachgelagerte Anbieter und wissenschaftliche Gremie
Der EU-AI-Act: Transparenzpflichten nach Artikel 50 – Ein praktischer Leitfaden
Artikel 50 des EU-AI-Acts verpflichtet Anbieter und Nutzer ab August 2026 zur Transparenz über KI-Einsatz und KI-generierte Inhalte in vier Situationen. Die Regeln gelten für alle KI-Systeme, nicht nur Hochrisiko-Systeme, und sind eine der größten Compliance-Herausforderungen für Organisationen.



