CHERRL ermöglicht durch kontrollierte Bias-Injektion eine reproduzierbare Analyse von Reward-Hacking-Mechanismen und automatische Detektion von Exploitations-Beginn in LLM-basiertem Training.
Anthropic expandiert Mythos-Zugang auf 150 neue Organisationen; Sicherheitsexperten warnen vor strukturellem Wandel durch Frontier-AI-Modelle und dem Risiko von Schwachstellenverkettung.
CVE-2025-48595 im Android Framework ermöglicht bereits exploitierter Privilegienerweiterung auf Geräten mit Android 14 oder neuer und wird von kommerzieller Spyware sowie staatlichen Akteuren gezielt gegen Journalisten und Entscheidungsträger eingesetzt.
BraveGuard verbessert die Sicherheitserkennung in Computer-Use-Agenten durch kontinuierliches Lernen aus realen Bedrohungsmustern, statt aus statischen Benchmarks.
GitHub übergab ungebündelte OAuth-Token an die Browser-Instanz von VSCode, wodurch Angreifer über manipulierte Jupyter-Notebook-Erweiterungen auf alle privaten Repositories eines Entwicklers zugreifen konnten.
Chinesische Hackergruppen greifen erstmals gezielt europäische Ziele mit der neuen Atlas-RAT-Malware an, was eine geografische Eskalation bekannter APT-Operationen signalisiert.
Eine autonome KI-Schwachstellen-Jägerin identifizierte eine zwei Jahre alte RCE-Lücke in Redis (CVE-2026-23479), die authentifizierten Angreifern Code-Ausführung ermöglichte und erst mit Patches vom 5. Mai 2026 geschlossen wurde.