Amazon Bedrock: InvokeGuardrailChecks API für agentenbasierte Anwendungen

16. June 202617. June 2026
AI Models, Claude Code

Die neue API ermöglicht es, Safeguards granular an jedem Punkt in Multi-Turn-Agent-Schleifen anzuwenden und basierend auf numerischen Scores eigene Schwellwerte sowie Aktionen (Block, Bypass, Retry) zu definieren.

Share on:

Anthropic überarbeitet Claude-Schutzmaßnahmen für LLM-Forschung

11. June 202611. June 2026
Anthropic, Claude AI, Regulation

Anthropic macht bisherige Einschränkungen für LLM-Forschung transparent und passt sie an, nachdem massive Kritik von der Forschungscommunity kam.

Share on:

Anthropic revidiert Safeguard-Politik für Claude bei frontier-LLM-Forschung

11. June 202611. June 2026
Anthropic, Claude AI, Regulation

Anthropic verzichtet auf heimliche Drosselung von Claude bei frontier-LLM-Forschung und macht Safeguards künftig transparenter.

Share on:

Anthropic versteckt Silent Guardrails gegen Frontier-LLM-Entwicklung in Claude Fable

10. June 202610. June 2026
Claude AI, Regulation

Anthropic implementiert unsichtbare, benutzer-unbewusste Einschränkungen in Claude Fable 5 für Anfragen zur LLM-Entwicklung, nicht als Fallback, sondern durch Prompt-Modifikation und Steering Vectors.

Share on:

Anthropic startet Claude Fable 5 und Claude Mythos 5

9. June 202610. June 2026
AI Models, Claude AI, Cybersecurity

Fable 5 setzt neue Benchmarks in Software-Engineering und Knowledge-Work durch längere autonome Laufzeiten, während Mythos 5 Cybersecurity-Fähigkeiten ohne Sicherheitsbeschränkungen bietet.

Share on:

Anthropic veröffentlicht abgeschwächte Version von Claude Mythos für allgemeine Nutzung

9. June 20269. June 2026
Claude AI, Cybersecurity, Regulation

Anthropic bietet mit Fable 5 eine Mythos-Variante mit Sicherheitsfiltern zur öffentlichen Nutzung an, während Project-Glasswing-Teilnehmer Zugang zu weniger beschränktem Claude Mythos 5 erhalten, begleitet von neuen Bundesregeln zur Kontrolle von Frontier-KI-Modellen.

Share on:

Amazon Bedrock: InvokeGuardrailChecks API für agentenbasierte Anwendungen

Anthropic überarbeitet Claude-Schutzmaßnahmen für LLM-Forschung

Anthropic revidiert Safeguard-Politik für Claude bei frontier-LLM-Forschung

Anthropic versteckt Silent Guardrails gegen Frontier-LLM-Entwicklung in Claude Fable

Anthropic startet Claude Fable 5 und Claude Mythos 5

Anthropic veröffentlicht abgeschwächte Version von Claude Mythos für allgemeine Nutzung

Lumi AI News

Rechtliches

Themenbereiche