Lineare Sonden zur Täuschungserkennung in LLMs zeigen kritische Robustheitslücken3. June 20263. June 2026AI Models, CybersecurityLineare Sonden zur Täuschungserkennung in LLMs funktionieren nur auf Trainingsdaten reliabel, nicht aber bei stilistischen Variationen — Style-Augmentation kann die Robustheit aber wiederherstellen. Share on: