Studie: LLMs geben Trainingsdaten selten ungefragt preis

5. June 20265. June 2026
AI Models, Cybersecurity, Regulation

LLMs können durch gezielte Prompt-Attacken zu Datenlecks gezwungen werden, geben Trainingsdaten in alltäglichen Nutzungsszenarien jedoch nur mit niedriger Wahrscheinlichkeit preis.

Share on:

Sam Altman räumt ein: Token-Kosten sind für Enterprise-Kunden kritisch geworden

5. June 20265. June 2026
AI Models, OpenAI

Firmen-KI-Ausgaben sind außer Kontrolle geraten; OpenAI verspricht effizientere Modelle, während das Jevons-Paradoxon längerfristig wieder steigende Nachfrage antreiben könnte.

Share on:

Unternehmen manipulieren Reddit zur gezielten Beeinflussung von KI-Sprachmodellen

5. June 20265. June 2026
AI Models, Cybersecurity, EU AI Act

Unternehmen nutzen Forum-Manipulation auf Reddit, um Trainingsdaten von KI-Sprachmodellen in ihrem Sinne zu verfälschen.

Share on:

Anthropic plädiert für koordinierte Pause bei der KI-Entwicklung

5. June 20265. June 2026
AI Models, Anthropic, Regulation

Anthropic schlägt ein koordiniertes Moratorium für die Entwicklung hochleistungsfähiger KI-Modelle vor, um das Risiko selbstverbessernder Systeme zu minimieren.

Share on:

Charity Majors über die Spannungen zwischen KI-Enthusiasten und KI-Skeptikern

5. June 20265. June 2026
AI Models, Claude Cowork

Die Herausforderung ist nicht, eine Seite zu wählen, sondern feedback loops zu schaffen, die zwischen der Geschwindigkeit von KI-beschleunigter Entwicklung und den Anforderungen an Zuverlässigkeit und Wartbarkeit vermitteln.

Share on:

Andon Labs testet KI-Modelle in realen Business-Szenarien statt Benchmarks

4. June 20264. June 2026
AI Models, Claude AI

Reale Geschäftsumgebungen mit echtem Geld, Inventar und Kunden offenbaren KI-Fähigkeiten und -Risiken, die klassische Benchmarks übersehen, von Preiskartellen über Deception bis zu rechtlichen Fehlinterpretationen.

Share on:

DAR: Agentenbasiertes Reasoning für deontische Logik und Regelanwendung

4. June 20264. June 2026
AI Models, Claude Code, Regulation

Agentenbasiertes Reasoning verbessert die Regelanwendung in Sprachmodellen, zeigt aber stark unterschiedliche Ergebnisse je nach Modellstärke und Aufgabentyp.

Share on:

CHERRL: Kontrollierte Analyse von Reward Hacking in LLM-basierten Reinforcement-Learning-Systemen

4. June 20264. June 2026
AI Models, Claude Code, Cybersecurity

CHERRL ermöglicht durch kontrollierte Bias-Injektion eine reproduzierbare Analyse von Reward-Hacking-Mechanismen und automatische Detektion von Exploitations-Beginn in LLM-basiertem Training.

Share on:

Claude Opus 4.8: Epistemische Kalibrierung sorgt für Spannungen im Produktiveinsatz

4. June 20264. June 2026
AI Models, Anthropic, Claude AI

Claude Opus 4.8 reduziert Halluzinationen und Unsicherheiten durch epistemische Kalibrierung, bremst aber durch übermäßige Warnhinweise den produktiven Einsatz.

Share on:

ThoughtFold: Verkürzte Reasoning-Ketten durch Präferenzlernen

4. June 20264. June 2026
AI Models, Claude AI

ThoughtFold identifiziert und entfernt überflüssige Explorations-Schritte in Reasoning-Ketten, senkt den Token-Verbrauch um 56% bei DeepSeek-R1-Distill-Qwen-7B und erhält dabei State-of-the-Art-Genauigkeit.

Share on:

AutoLab: Benchmark testet Frontier-Modelle bei langfristiger Optimierung

4. June 20264. June 2026
AI Models, Claude AI

Langfristige iterative Verbesserung, nicht einzelne hochwertige Antworten, ist die entscheidende Fähigkeit für autonome KI-Agenten bei realen Engineering-Aufgaben.

Share on:

BraveGuard: Selbstlernendes Schutzystem für Computer-Use-Agenten

4. June 20264. June 2026
AI Models, Claude AI, Cybersecurity

BraveGuard verbessert die Sicherheitserkennung in Computer-Use-Agenten durch kontinuierliches Lernen aus realen Bedrohungsmustern, statt aus statischen Benchmarks.

Share on:

« Previous
1
…
18
19
20
21
22
…
49
Next »

Studie: LLMs geben Trainingsdaten selten ungefragt preis

Sam Altman räumt ein: Token-Kosten sind für Enterprise-Kunden kritisch geworden

Unternehmen manipulieren Reddit zur gezielten Beeinflussung von KI-Sprachmodellen

Anthropic plädiert für koordinierte Pause bei der KI-Entwicklung

Charity Majors über die Spannungen zwischen KI-Enthusiasten und KI-Skeptikern

Andon Labs testet KI-Modelle in realen Business-Szenarien statt Benchmarks

DAR: Agentenbasiertes Reasoning für deontische Logik und Regelanwendung

CHERRL: Kontrollierte Analyse von Reward Hacking in LLM-basierten Reinforcement-Learning-Systemen

Claude Opus 4.8: Epistemische Kalibrierung sorgt für Spannungen im Produktiveinsatz

ThoughtFold: Verkürzte Reasoning-Ketten durch Präferenzlernen

AutoLab: Benchmark testet Frontier-Modelle bei langfristiger Optimierung

BraveGuard: Selbstlernendes Schutzystem für Computer-Use-Agenten

Lumi AI News

Rechtliches

Themenbereiche