NEULLMs und KI-Agenten: Sicherheitslücken durch Prompt Injection und manipulierte Eingaben

30. June 20261. July 2026
AI Models, Cybersecurity

Große Sprachmodelle sind anfällig für relativ triviale Prompt-Injektionen und manipulierte multimodale Eingaben, die zu Datenlecks und Safety-Verstößen führen.

Share on:

Anthropic-Forscher demonstrieren Sicherheitslücke in Claude durch einfache Prompts

16. June 202616. June 2026
Anthropic, Claude AI, Cybersecurity

Claude 3.5 Sonnet lässt sich durch einfache Prompts zum Beheben von Code-Fehlern manipulieren und hebelt dabei seine eigenen Sicherheitsrichtlinien aus.

Share on:

White House testet Anthropic-Modell Fable mit absichtlich unsicherem Code

16. June 202616. June 2026
Anthropic, Claude AI, Cybersecurity

Anthropics Modell Fable verweigerte eine direkte Sicherheitsprüfung von unsicherem Code, führte aber eine Korrektur durch – ein Verhalten, das Experten als gewollte Sicherheitsfunktion einordnen.

Share on:

NEULLMs und KI-Agenten: Sicherheitslücken durch Prompt Injection und manipulierte Eingaben

Anthropic-Forscher demonstrieren Sicherheitslücke in Claude durch einfache Prompts

White House testet Anthropic-Modell Fable mit absichtlich unsicherem Code

Lumi AI News

Rechtliches

Themenbereiche