NEULLMs und KI-Agenten: Sicherheitslücken durch Prompt Injection und manipulierte Eingaben

30. June 20261. July 2026
AI Models, Cybersecurity

Große Sprachmodelle sind anfällig für relativ triviale Prompt-Injektionen und manipulierte multimodale Eingaben, die zu Datenlecks und Safety-Verstößen führen.

Share on:

NEUBioShocking-Angriff nutzt AI-Browser aus und stiehlt Benutzerdetails

30. June 202630. June 2026
Claude AI, Cybersecurity, OpenAI

AI-Browser lassen sich durch Spielkontexte manipulieren, um Benutzeranmeldedaten an Angreifer weiterzugeben.

Share on:

GitHub-Repository-Trick täuscht KI-Agenten in Ausführung von Schadsoftware

27. June 202627. June 2026
AI Models, Claude Code, Cybersecurity

KI-basierte Code-Agenten können durch präparierte GitHub-Repositories zur Ausführung verborgenerer Malware bewogen werden, ohne dass gängige Sicherheitsprüfungen das Risiko erkennen.

Share on:

Prompt-Injection-Test: 6.000 Angriffe auf Anthropics Opus ohne Erfolg

26. June 202626. June 2026
Claude AI, Cybersecurity

Anthropics Opus 4.6 widerstand in einem öffentlichen Sicherheitstest 6.000 Prompt-Injection-Angriffen ohne Erfolg, was auf verbesserte Abwehrmechanismen hindeutet — solche Stabilitätsergebnisse ersetzen aber kein umfassendes Security-Design in der Produktion.

Share on:

macOS-Malware “Gaslight” verwirrt KI-gestützte Analyse-Tools durch gefälschte Fehler

25. June 202625. June 2026
Claude AI, Cybersecurity

Malware kann KI-basierte Sicherheitsanalyse durch gezielt eingebettete Fake-Fehlermeldungen und Prompt-Injections umgehen.

Share on:

Gaslight: macOS-Malware nutzt Prompt Injection gegen KI-gestützte Malware-Analyse

25. June 202625. June 2026
AI Models, Cybersecurity

Gaslight demonstriert eine neue Angriffsvariante, bei der Malware direkt die KI-Werkzeuge von Sicherheitsanalytikern kompromittiert, um einer Detektion zu entgehen.

Share on:

Sprachmodelle verwechseln Systemvorgaben mit Benutzer-Input

23. June 202623. June 2026
Claude AI, Cybersecurity

Sprachmodelle reagieren stärker auf die Formatierung von Text als auf dessen tatsächlichen Inhalt und können dadurch durch geschickt stilisierte Eingaben manipuliert werden, die wie interne Systembefehle aussehen.

Share on:

AI-Sicherheit nach Mythos-Export-Kontrolle: Prompt Injection und Red Teaming im Fokus

22. June 202622. June 2026
AI Models, Claude AI, Cybersecurity

AI-Sicherheit erfordert fundamentale Unterschiede zu traditioneller Cybersecurity: Prompt Injection schafft eine neue Exploit-Klasse für Agenten, spezialisierte Red-Teaming-Modelle schlagen Menschen beim Aufdecken von Schwächen, und größere Modelle sind nicht automatisch robuster.

Share on:

M365 Copilot SearchLeak: Parameter-Injection-Attacken gegen KI-Suche

19. June 202619. June 2026
Claude AI, Cybersecurity, NIS2

Parameter-to-Prompt-Injection (P2P) wird zur neuen Angriffsfläche, wenn KI-Suchanwendungen URL-Parameter als natürlichsprachliche Anweisungen verarbeiten.

Share on:

Anthropic-Forscher demonstrieren Sicherheitslücke in Claude durch einfache Prompts

16. June 202616. June 2026
Anthropic, Claude AI, Cybersecurity

Claude 3.5 Sonnet lässt sich durch einfache Prompts zum Beheben von Code-Fehlern manipulieren und hebelt dabei seine eigenen Sicherheitsrichtlinien aus.

Share on:

Runtime-Signale zur Erkennung kompromittierter KI-Agenten

15. June 202615. June 2026
Claude AI, Cybersecurity

Legitime KI-Agenten erfüllen naturgemäß alle drei Kriterien der „letalen Trifekta” (Datenzugriff, externe Inhalte, externe Kommunikation), daher muss sich die Sicherheit vom Architektur-Design zu Laufzeit-Überwachung verlagern.

Share on:

OpenClaw für Prompt Injections über Nachrichtenobjekte anfällig

15. June 202615. June 2026
AI Models, Cybersecurity

OpenClaw lässt sich durch Prompt Injections in Nachrichtenobjekten dazu bringen, die Anweisungen des Angreifers statt des Besitzers auszuführen.

Share on:

NEULLMs und KI-Agenten: Sicherheitslücken durch Prompt Injection und manipulierte Eingaben

NEUBioShocking-Angriff nutzt AI-Browser aus und stiehlt Benutzerdetails

GitHub-Repository-Trick täuscht KI-Agenten in Ausführung von Schadsoftware

Prompt-Injection-Test: 6.000 Angriffe auf Anthropics Opus ohne Erfolg

macOS-Malware “Gaslight” verwirrt KI-gestützte Analyse-Tools durch gefälschte Fehler

Gaslight: macOS-Malware nutzt Prompt Injection gegen KI-gestützte Malware-Analyse

Sprachmodelle verwechseln Systemvorgaben mit Benutzer-Input

AI-Sicherheit nach Mythos-Export-Kontrolle: Prompt Injection und Red Teaming im Fokus

M365 Copilot SearchLeak: Parameter-Injection-Attacken gegen KI-Suche

Anthropic-Forscher demonstrieren Sicherheitslücke in Claude durch einfache Prompts

Runtime-Signale zur Erkennung kompromittierter KI-Agenten

OpenClaw für Prompt Injections über Nachrichtenobjekte anfällig

Lumi AI News

Rechtliches

Themenbereiche