OpenAI schlägt Pflicht-Evaluierungen vor Modelfreigabe vor

4. June 20264. June 2026
AI Models, EU AI Act, Regulation

OpenAI fordert verpflichtende Bundesevaluierungen vor KI-Freigabe, lehnt aber Regulierungsgenehmigungen ab und setzt damit auf einen kontrollierten Mittelweg zwischen freiwilligen Zusagen und strenger staatlicher Kontrolle.

Share on:

DAR: Agentenbasiertes Reasoning für deontische Logik und Regelanwendung

4. June 20264. June 2026
AI Models, Claude Code, Regulation

Agentenbasiertes Reasoning verbessert die Regelanwendung in Sprachmodellen, zeigt aber stark unterschiedliche Ergebnisse je nach Modellstärke und Aufgabentyp.

Share on:

ThreatsDay Bulletin: KI-Agenten, C2-Tools und neue Sicherheitslücken im Überblick

4. June 20264. June 2026
AI Models, Cybersecurity

KI-Agenten werden zur unmittelbaren Bedrohung in Produktionssystemen, während klassische Exploits und gefälschte Tools weiterhin ungebremst eingesetzt werden.

Share on:

Hugging Face Transformers: RCE-Lücke in Modellkonfigurationen umgeht Sicherheitsmaßnahmen

4. June 20264. June 2026
AI Models, Claude Code, Cybersecurity

Hugging Face Transformers erlaubt stumme Remote Code Execution über getarnte Parameter in Modellkonfigurationen, solange das optionale Kernels-Paket installiert ist (CVE-2026-4372, gepatcht in 5.3.0).

Share on:

KI-generierter Wurm zeigt hohe Anpassungsfähigkeit an Sicherheitsmaßnahmen

4. June 20264. June 2026
AI Models, Cybersecurity

KI-generierte Malware kann sich eigenständig an Sicherheitsmaßnahmen anpassen und stellt damit etablierte Abwehrstrategien vor neue Herausforderungen.

Share on:

GreyVibe skaliert Cyberangriffe auf die Ukraine mit ChatGPT und Gemini

4. June 20264. June 2026
AI Models, Cybersecurity, OpenAI

GreyVibe kompensiert durch intensive Nutzung kommerzieller KI-Tools technische Defizite und ermöglicht damit eine Angriffsskalierung, die normalerweise große personelle Ressourcen erfordert.

Share on:

CHERRL: Kontrollierte Analyse von Reward Hacking in LLM-basierten Reinforcement-Learning-Systemen

4. June 20264. June 2026
AI Models, Claude Code, Cybersecurity

CHERRL ermöglicht durch kontrollierte Bias-Injektion eine reproduzierbare Analyse von Reward-Hacking-Mechanismen und automatische Detektion von Exploitations-Beginn in LLM-basiertem Training.

Share on:

Claude Opus 4.8: Epistemische Kalibrierung sorgt für Spannungen im Produktiveinsatz

4. June 20264. June 2026
AI Models, Anthropic, Claude AI

Claude Opus 4.8 reduziert Halluzinationen und Unsicherheiten durch epistemische Kalibrierung, bremst aber durch übermäßige Warnhinweise den produktiven Einsatz.

Share on:

ThoughtFold: Verkürzte Reasoning-Ketten durch Präferenzlernen

4. June 20264. June 2026
AI Models, Claude AI

ThoughtFold identifiziert und entfernt überflüssige Explorations-Schritte in Reasoning-Ketten, senkt den Token-Verbrauch um 56% bei DeepSeek-R1-Distill-Qwen-7B und erhält dabei State-of-the-Art-Genauigkeit.

Share on:

AutoLab: Benchmark testet Frontier-Modelle bei langfristiger Optimierung

4. June 20264. June 2026
AI Models, Claude AI

Langfristige iterative Verbesserung, nicht einzelne hochwertige Antworten, ist die entscheidende Fähigkeit für autonome KI-Agenten bei realen Engineering-Aufgaben.

Share on:

STRIDE: Trainingsdateneinfluss in LLMs via Sparse Recovery nachverfolgen

4. June 20264. June 2026
AI Models, Claude Code

STRIDE formalisiert Trainingsdatenzuordnung als Sparse-Recovery-Problem im Aktivierungsraum und erreicht dabei eine Größenordnung schneller Ergebnisse als gradientbasierte Verfahren.

Share on:

BraveGuard: Selbstlernendes Schutzystem für Computer-Use-Agenten

4. June 20264. June 2026
AI Models, Claude AI, Cybersecurity

BraveGuard verbessert die Sicherheitserkennung in Computer-Use-Agenten durch kontinuierliches Lernen aus realen Bedrohungsmustern, statt aus statischen Benchmarks.

Share on:

« Previous
1
…
25
26
27
28
29
…
41
Next »

OpenAI schlägt Pflicht-Evaluierungen vor Modelfreigabe vor

DAR: Agentenbasiertes Reasoning für deontische Logik und Regelanwendung

ThreatsDay Bulletin: KI-Agenten, C2-Tools und neue Sicherheitslücken im Überblick

Hugging Face Transformers: RCE-Lücke in Modellkonfigurationen umgeht Sicherheitsmaßnahmen

KI-generierter Wurm zeigt hohe Anpassungsfähigkeit an Sicherheitsmaßnahmen

GreyVibe skaliert Cyberangriffe auf die Ukraine mit ChatGPT und Gemini

CHERRL: Kontrollierte Analyse von Reward Hacking in LLM-basierten Reinforcement-Learning-Systemen

Claude Opus 4.8: Epistemische Kalibrierung sorgt für Spannungen im Produktiveinsatz

ThoughtFold: Verkürzte Reasoning-Ketten durch Präferenzlernen

AutoLab: Benchmark testet Frontier-Modelle bei langfristiger Optimierung

STRIDE: Trainingsdateneinfluss in LLMs via Sparse Recovery nachverfolgen

BraveGuard: Selbstlernendes Schutzystem für Computer-Use-Agenten

Lumi AI News

Rechtliches

Themenbereiche