AI-Agent-Skills erfordern kontinuierliche Runtime-Überwachung, nicht nur statische Analysen beim Deployment, da Sicherheitsrichtlinien nach der Genehmigung geändert werden können.
Ein bewusst bösartiges AI-Agent-Skill umging alle getesteten Security-Scanner und verbreitete sich auf 26.000 Agenten, einige davon in Unternehmenskonten.
AutoJack nutzt AI-Agenten als Einfallstor: Eine bösartige Webseite kann ohne Benutzerinteraktion oder Authentifizierung Code auf dem Host-System ausführen.
Vergiftete Dokumente können Reasoning-basierte KI-Guardrails zu DoS-Waffen machen, indem sie Sicherheitssysteme selbst als Ressourcensenke nutzen – ein neuer Angriffsvektor mit Konzentrationrisiken in gemeinsamer Governance-Infrastruktur.
Angreifer können Reasoning-Guardrails von KI-Agenten durch gezielt manipulierte Eingaben zu einer Ressourcenerschöpfung führen, ohne die Sicherheitsmechanismen selbst zu umgehen.
Legitime KI-Agenten erfüllen naturgemäß alle drei Kriterien der „letalen Trifekta” (Datenzugriff, externe Inhalte, externe Kommunikation), daher muss sich die Sicherheit vom Architektur-Design zu Laufzeit-Überwachung verlagern.