Anthropic veröffentlicht Mythos mit Sicherheitsrichtlinien gegen Cybersecurity-Missbrauch

10. June 202610. June 2026
AI Models, Anthropic, Cybersecurity

Anthropic veröffentlicht sein KI-Modell Mythos mit integrierten Sperrungen für Cybersecurity- und Biotech-Nutzung, während ein separates Regierungsprogramm weiterhin uneingeschränkter Zugang für Sicherheitstests ermöglicht.

Share on:

Anthropic veröffentlicht Claude Fable 5 als erste Mythos-Klasse im allgemeinen Zugang

10. June 202610. June 2026
AI Models, Anthropic, Claude AI

Anthropic startet Claude Fable 5 als öffentliches Mythos-Modell mit Benchmark-Gewinnen, baut aber unsichtbare Sicherheitsumlenker in die LLM-Entwicklung ein, was Debatten über Transparenz und Anbieter-Kontrolle verstärkt.

Share on:

FlowTracer: Gezieltes Reinforcement Learning durch Nachverfolgung von Informationsfluss in LLMs

10. June 202610. June 2026
AI Models, Claude AI, Claude Code

FlowTracer modelliert Informationspropagation als gerichteten Graphen und leitet Token-Credits aus globaler Flussstruktur ab, um Reinforcement-Learning-Signale präzise auf entscheidende Reasoning-Schritte zu konzentrieren.

Share on:

FlowTracer: Gezielte Reinforcement-Learning in LLMs durch Attention-basierte Informationsflussverfolgung

10. June 202610. June 2026
AI Models, Claude Code, Claude Cowork

FlowTracer weist Tokens Credit basierend auf ihrem gemessenen Informationsdurchsatz im Attention-Graphen zu statt alle gleich zu behandeln, was konsistente Leistungsgewinne bei Reasoning-Aufgaben bringt.

Share on:

Multi-Turn-Reasoning-Modelle: Verborgene Sicherheitsfehler entkommen etablierten Tests

10. June 202610. June 2026
AI Models, Claude AI

Multi-Turn-Reasoning-Modelle können sichere interne Gedankenketten haben, aber dennoch schädliche Outputs produzieren, was in Standard-Sicherheitstests unsichtbar bleibt.

Share on:

Reasoning-Modelle zeigen versteckte Sicherheitslücken über mehrere Gesprächsrunden

10. June 202610. June 2026
AI Models, Claude AI, Cybersecurity

Multi-Turn-Reasoning-Modelle können sichere Oberflächenmetriken aufrechterhalten, während ihre internen Zustände über Gesprächsrunden hinweg kompromittiert sind oder ihre sichere interne Logik in schädlichen Outputs ignoriert wird.

Share on:

PACT: Effizientere Kommunikation in Multi-Agent-Systemen mit Claude

10. June 202610. June 2026
AI Models, Claude Code

Strukturierte, handlungsorientierte Agenten-Kommunikation (PACT) senkt Token-Kosten in Multi-Agent-Systemen ohne Performance-Einbußen.

Share on:

BenSyc: Benchmark für Schmeichelei in bengalischen Sprachmodellen

10. June 202610. June 2026
AI Models

Sprachmodelle erreichen bei der Unterscheidung zwischen empathischer Unterstützung und übertriebener Bestätigung in bengalischen Gesprächen nur 61–62 Macro-F1, was erhebliche Risiken für sozial sensible Anwendungen signalisiert.

Share on:

ARM: Autoregressive Modell für einheitliche Bild- und Textverarbeitung

10. June 202610. June 2026
AI Models

ARM kombiniert diskrete visuelle Token mit einem 7-Milliarden-Parameter-Modell, um Bild- und Texttasks einheitlich als Token-Vorhersagen zu lösen.

Share on:

Workflow-GYM: Benchmark offenbart Grenzen von KI-Agenten bei komplexen GUI-Aufgaben

10. June 202610. June 2026
AI Models, Claude Code, Claude Cowork

Aktuelle KI-Agenten können langfristige, professionelle GUI-Workflows nicht zuverlässig ausführen und scheitern an Konsistenzerhalt, Fehlerausbreitung und domänenspezifischem Verständnis.

Share on:

Claude Fable 5: Anthropics neues Grenzmodell mit strikten Sicherheitsvorkehrungen

10. June 202610. June 2026
AI Models, Claude AI

Claude Fable 5 kostet doppelt so viel wie Claude Opus 4.8, zeigt aber bei komplexen Wissensabfragen deutlich überlegene Leistung.

Share on:

Lookahead Sparse Attention: DeepSeek-V4 reduziert KV-Cache auf 13,5 Prozent

9. June 202610. June 2026
AI Models, Claude Code

LSA prognostiziert relevante Kontextabschnitte vorab und behält nur diese im GPU-Speicher, wodurch der KV-Cache um über 86 Prozent komprimiert wird, ohne die Genauigkeit zu opfern.

Share on:

« Previous
1
…
20
21
22
23
24
…
42
Next »

Anthropic veröffentlicht Mythos mit Sicherheitsrichtlinien gegen Cybersecurity-Missbrauch

Anthropic veröffentlicht Claude Fable 5 als erste Mythos-Klasse im allgemeinen Zugang

FlowTracer: Gezieltes Reinforcement Learning durch Nachverfolgung von Informationsfluss in LLMs

FlowTracer: Gezielte Reinforcement-Learning in LLMs durch Attention-basierte Informationsflussverfolgung

Multi-Turn-Reasoning-Modelle: Verborgene Sicherheitsfehler entkommen etablierten Tests

Reasoning-Modelle zeigen versteckte Sicherheitslücken über mehrere Gesprächsrunden

PACT: Effizientere Kommunikation in Multi-Agent-Systemen mit Claude

BenSyc: Benchmark für Schmeichelei in bengalischen Sprachmodellen

ARM: Autoregressive Modell für einheitliche Bild- und Textverarbeitung

Workflow-GYM: Benchmark offenbart Grenzen von KI-Agenten bei komplexen GUI-Aufgaben

Claude Fable 5: Anthropics neues Grenzmodell mit strikten Sicherheitsvorkehrungen

Lookahead Sparse Attention: DeepSeek-V4 reduziert KV-Cache auf 13,5 Prozent

Lumi AI News

Rechtliches

Themenbereiche