Sprachmodelle verwechseln Systemvorgaben mit Benutzer-Input

23. June 202623. June 2026
Claude AI, Cybersecurity

Sprachmodelle reagieren stärker auf die Formatierung von Text als auf dessen tatsächlichen Inhalt und können dadurch durch geschickt stilisierte Eingaben manipuliert werden, die wie interne Systembefehle aussehen.

Share on:

Sprachmodelle verwechseln Systemvorgaben mit Benutzer-Input

Lumi AI News

Rechtliches

Themenbereiche