NEUSafePyramid: Benchmark zeigt Schwächen von LLM-Guardrails bei kontextabhängigen Richtlinien

30. June 202630. June 2026
AI Models, Claude AI, Cybersecurity

Selbst GPT-4.5 erkennt bei kontextabhängigen Sicherheitsrichtlinien vollständig kritische Regelkonfigurationen nur in 54% der einfachen, 35% der mittleren und 13% der komplexen Fälle.

Share on:

NEUSafePyramid: Benchmark zeigt Schwächen von LLM-Guardrails bei kontextabhängigen Richtlinien

Lumi AI News

Rechtliches

Themenbereiche