Visuellen Weltmodellen lassen sich durch visuell unauffällige Bildmanipulationen systematisch zur Generierung fehlerhafter Vorhersagen bewegen, ohne dass dabei zukünftige Daten oder Nutzereingaben bekannt sein müssen.
Aktuelle KI-Web-Agenten haben keine zuverlässigen Defensen gegen Prompt Injection und können Angriffe unbemerkt erfüllen, während Nutzer nichts von der Gefahr bemerken.