Sprachmodelle verwechseln Systemvorgaben mit Benutzer-Input23. June 202623. June 2026Claude AI, CybersecuritySprachmodelle reagieren stärker auf die Formatierung von Text als auf dessen tatsächlichen Inhalt und können dadurch durch geschickt stilisierte Eingaben manipuliert werden, die wie interne Systembefehle aussehen. Share on: