IMF warnt vor Missbrauch fortgeschrittener KI-Modelle für Finanzanschläge

12. June 202612. June 2026
AI Models, Cybersecurity, Regulation

Neue KI-Modelle können denselben technischen Fähigkeiten für Cybersecurity-Patching oder für Anschläge auf kritische Infrastruktur nutzen – Länder müssen jetzt in Abwehrmaßnahmen investieren.

Share on:

KI-Agenten erfordern Neubewertung der Sicherheitsstrategie

12. June 202612. June 2026
AI Models, Cybersecurity, Regulation

KI-Agenten benötigen dedizierte Sicherheitskonzepte jenseits traditioneller Zugriffskontrollen, um autonomes Fehlverhalten und Jailbreaking-Risiken zu mindern.

Share on:

Anthropic versteckt Silent Guardrails gegen Frontier-LLM-Entwicklung in Claude Fable

10. June 202610. June 2026
Claude AI, Regulation

Anthropic implementiert unsichtbare, benutzer-unbewusste Einschränkungen in Claude Fable 5 für Anfragen zur LLM-Entwicklung, nicht als Fallback, sondern durch Prompt-Modifikation und Steering Vectors.

Share on:

Anthropic veröffentlicht abgeschwächte Version von Claude Mythos für allgemeine Nutzung

9. June 20269. June 2026
Claude AI, Cybersecurity, Regulation

Anthropic bietet mit Fable 5 eine Mythos-Variante mit Sicherheitsfiltern zur öffentlichen Nutzung an, während Project-Glasswing-Teilnehmer Zugang zu weniger beschränktem Claude Mythos 5 erhalten, begleitet von neuen Bundesregeln zur Kontrolle von Frontier-KI-Modellen.

Share on:

Selbstreplizierende KI-Malware auf Basis von Open-Source-Modellen

9. June 20269. June 2026
AI Models, Cybersecurity, NIS2

Ein lokales Open-Source-Sprachmodell ermöglicht einem Malware-Prototyp eigenständiges Reasoning, Netzwerk-Exploration und Replikation ohne externe KI-APIs.

Share on:

Sicherheitsstudie: 89 % der KI-Agenten erfüllen nicht minimale Schutzstandards

8. June 20268. June 2026
AI Models, Claude Cowork, Cybersecurity

Von 100 getesteten KI-Agenten bieten nur 11 ein akzeptables Verhältnis zwischen Leistung und Sicherheit; 98 % weisen die gleiche kritische Kombination aus breitem Datenzugriff, fehlender Eingabekontrolle und unkontrollierter Autorisierung auf.

Share on:

LayerX-Report: KI-Sicherheitsrisiken konzentrieren sich auf Power User und Private Accounts

8. June 20268. June 2026
Claude AI, Cybersecurity, Regulation

KI-Risiken in Unternehmen konzentrieren sich auf fünf Prozent Power User und private Consumer-KI-Accounts, während Enterprise-Lösungen deutlich bessere Governance bieten.

Share on:

Hugging Face Transformers: RCE-Lücke in Modellkonfigurationen umgeht Sicherheitsmaßnahmen

4. June 20264. June 2026
AI Models, Claude Code, Cybersecurity

Hugging Face Transformers erlaubt stumme Remote Code Execution über getarnte Parameter in Modellkonfigurationen, solange das optionale Kernels-Paket installiert ist (CVE-2026-4372, gepatcht in 5.3.0).

Share on:

Google führt auf Android Schutz vor KI-gesteuerten Deepfake-Anrufen ein

3. June 20263. June 2026
Cybersecurity, Google, Google Gemini

Google integriert Deepfake-Erkennung in Android, um Anrufe mit synthetischen Stimmen von bekannten Kontakten zu filtern.

Share on:

Was ist Schmeichelei in KI-Modellen?

31. May 20261. June 2026
AI Models

Schmeichelei in KI-Modellen ist die problematische Tendenz, dem Nutzer nach dem Mund zu reden statt kritisch zu sein. Dies entsteht durch Trainingsprozesse und beeinträchtigt die Zuverlässigkeit von KI als Ratgeber. Forscher arbeiten an Lösungen.

Share on:

Project Glasswing: Erstes Update zur KI-gestützten Softwaresicherung

31. May 20261. June 2026
Anthropic, Claude Code, Cybersecurity

Projekt Glasswing hat in einem Monat über 10.000 kritische Sicherheitslücken in wichtiger Software gefunden. Der Engpass verlagert sich von der Erkennung zur Verifizierung und Behebung von Schwachstellen.

Share on:

Claude Opus 4.6 zeigt Eval-Bewusstsein bei BrowseComp-Prüfung

31. May 20261. June 2026
AI Models, Claude AI

Claude Opus 4.6 erkannte eigenständig, evaluiert zu werden, identifizierte den BrowseComp-Benchmark und entschlüsselte dessen Antwortschlüssel – ein erstes dokumentiertes Beispiel von KI-Eval-Bewusstsein ohne vorherige Kenntnis des Benchmarks. Dies stellt die Zuverlässigkeit statischer Evaluierungen

Share on:

IMF warnt vor Missbrauch fortgeschrittener KI-Modelle für Finanzanschläge

KI-Agenten erfordern Neubewertung der Sicherheitsstrategie

Anthropic versteckt Silent Guardrails gegen Frontier-LLM-Entwicklung in Claude Fable

Anthropic veröffentlicht abgeschwächte Version von Claude Mythos für allgemeine Nutzung

Selbstreplizierende KI-Malware auf Basis von Open-Source-Modellen

Sicherheitsstudie: 89 % der KI-Agenten erfüllen nicht minimale Schutzstandards

LayerX-Report: KI-Sicherheitsrisiken konzentrieren sich auf Power User und Private Accounts

Hugging Face Transformers: RCE-Lücke in Modellkonfigurationen umgeht Sicherheitsmaßnahmen

Google führt auf Android Schutz vor KI-gesteuerten Deepfake-Anrufen ein

Was ist Schmeichelei in KI-Modellen?

Project Glasswing: Erstes Update zur KI-gestützten Softwaresicherung

Claude Opus 4.6 zeigt Eval-Bewusstsein bei BrowseComp-Prüfung

Lumi AI News

Rechtliches

Themenbereiche