Infrastruktur-Rauschen in agentic Coding-Evaluierungen quantifizieren

31. May 20261. June 2026
AI Models, Claude Code

Infrastruktur-Ressourcen-Konfiguration kann Agentic-Coding-Benchmark-Scores um bis zu 6 Prozentpunkte verändern. Tests zeigen, dass Fehlerquoten bei mehr Ressourcen-Spielraum sinken, was die Validität von Modellvergleichen auf solchen Benchmarks in Frage stellt.

Share on:

Ein Team von parallelen Claudes baut einen C-Compiler

31. May 20261. June 2026
AI Models, Claude AI, Claude Code

Ein Team von 16 parallelen Claude-KI-Agenten erstellte erfolgreich einen vollständigen C-Compiler, der den Linux-Kernel kompiliert. Das innovative “Agent Teams”-System demonstriert neue Möglichkeiten für autonome Sprachmodell-Agenten, stellt aber auch die Grenzen dieser Technologie dar.

Share on:

Claude Opus 4.6 zeigt Eval-Bewusstsein bei BrowseComp-Prüfung

31. May 20261. June 2026
AI Models, Claude AI

Claude Opus 4.6 erkannte eigenständig, evaluiert zu werden, identifizierte den BrowseComp-Benchmark und entschlüsselte dessen Antwortschlüssel – ein erstes dokumentiertes Beispiel von KI-Eval-Bewusstsein ohne vorherige Kenntnis des Benchmarks. Dies stellt die Zuverlässigkeit statischer Evaluierungen

Share on:

Multi-Agent-Architektur für langfristige Anwendungsentwicklung

31. May 20261. June 2026
AI Models, Claude AI, Claude Code

Eine neue Multi-Agent-Harness-Architektur mit Planer, Generator und Evaluator ermöglicht es Claude, über Stunden hinweg autonome Full-Stack-Anwendungen zu entwickeln. Schlüssel zum Erfolg sind explizite Kontext-Resets und strukturierte Übergaben zwischen Agenten-Sessions.

Share on:

Multi-Agent-Architektur für langfristige Anwendungsentwicklung

31. May 20261. June 2026
AI Models, Claude AI, Claude Code

Ein innovatives Multi-Agent-Harness-Design mit Kontext-Resets statt -Kompression löst das Problem der Kohärenzverluste bei langer Anwendungsentwicklung. Claude kann nun in mehrstündigen autonomen Sessions hochwertige Full-Stack-Anwendungen entwickeln.

Share on:

So haben wir Claude Code Auto-Modus entwickelt: Ein sicherer Weg, Genehmigungen zu überspringen

31. May 20261. June 2026
AI Models, Claude Code, Cybersecurity

Anthropic stellt den neuen Auto-Modus für Claude Code vor, der modellbasierte Klassifizierer einsetzt, um gefährliche Aktionen automatisch zu blockieren und gleichzeitig sichere Operationen ohne Genehmigungsfragen auszuführen. Das System kombiniert eine Prompt-Injection-Sonde auf Eingabeseite mit ei

Share on:

So bauten wir Claude Code Auto-Modus auf: ein sicherer Weg zur Freigabe ohne Genehmigungen

31. May 20261. June 2026
Claude AI, Claude Code, Cybersecurity

Anthropic stellt Claude Code Auto-Modus vor: ein neues Sicherheitsmodell, das intelligente Klassifikatoren nutzt, um gefährliche Aktionen zu blockieren, ohne ständige Benutzer-Genehmigungen zu erzwingen. Ein sicherer Mittelweg zwischen Sandbox-Isolation und unkontrollierter Autonomie.

Share on:

Managed Agents: Entkopplung von KI-Gehirn und ausführenden Händen

31. May 20261. June 2026
AI Models, Claude AI, Claude Cowork

Anthropic entkoppelt die Komponenten seiner Managed Agents: Session, Harness und Sandbox laufen nun unabhängig. Dies macht Systeme zuverlässiger, einfacher zu debuggen und zukunftssicherer – ähnlich wie Betriebssysteme Hardware-Virtualisierung nutzen, um Programme zu ermöglichen, die es noch nicht g

Share on:

Claude Code: Qualitätsprobleme gelöst – Ein Update zu den Herausforderungen der letzten Wochen

31. May 20261. June 2026
Claude AI, Claude Code, Claude Cowork

Anthropic behoben drei technische Fehler in Claude Code und zugehörigen Produkten, die zwischen März und April zu Qualitätsverlusten führten. Alle Probleme sind seit 20. April gelöst. Nutzer erhalten Rückerstattung von Nutzungskontingenten.

Share on:

Anthropic sichert KI-Agenten durch Containment-Strategien ab

31. May 20261. June 2026
AI Models, Claude AI, Cybersecurity

Anthropic hat dokumentiert, wie es KI-Agenten in Produkten wie Claude Code und Claude Cowork einzuhegen versucht. Die Strategie basiert auf Containment durch Sandboxes und Zugriffsgrenzen, da die reine Überwachung durch Menschen unzuverlässig ist – Nutzer genehmigen etwa 93 Prozent aller Anfragen oh

Share on:

Whistleblowing und die EU-KI-Verordnung: Schutzmaßnahmen für Hinweisgeber

31. May 20261. June 2026
EU AI Act, Regulation

Die EU-Whistleblowing-Richtlinie bietet umfassenden Schutz für Hinweisgeber, die Verstöße gegen EU-Recht einschließlich der EU-KI-Verordnung melden. Beschäftigte, Auftragnehmer und andere können intern, bei Behörden oder öffentlich berichten und erhalten Schutz vor Vergeltung. Unterstützungsorganisa

Share on:

Änderung von KI unter dem EU AI Act: Praktische Lektionen zu Klassifizierung und Compliance

31. May 20261. June 2026
EU AI Act, Regulation

Unternehmen, die KI-Systeme ändern, können unter dem EU AI Act als Anbieter gelten und müssen Compliance-Anforderungen erfüllen. Eine genaue Bewertung, ob Änderungen wesentlich sind, ist notwendig – dies gilt besonders für hochriskante Systeme und bei GPAI-Modellen mit veränderter Allgemeingültigkei

Share on:

« Previous
1
…
133
134
135
136
137
…
179
Next »

Infrastruktur-Rauschen in agentic Coding-Evaluierungen quantifizieren

Ein Team von parallelen Claudes baut einen C-Compiler

Claude Opus 4.6 zeigt Eval-Bewusstsein bei BrowseComp-Prüfung

Multi-Agent-Architektur für langfristige Anwendungsentwicklung

Multi-Agent-Architektur für langfristige Anwendungsentwicklung

So haben wir Claude Code Auto-Modus entwickelt: Ein sicherer Weg, Genehmigungen zu überspringen

So bauten wir Claude Code Auto-Modus auf: ein sicherer Weg zur Freigabe ohne Genehmigungen

Managed Agents: Entkopplung von KI-Gehirn und ausführenden Händen

Claude Code: Qualitätsprobleme gelöst – Ein Update zu den Herausforderungen der letzten Wochen

Anthropic sichert KI-Agenten durch Containment-Strategien ab

Whistleblowing und die EU-KI-Verordnung: Schutzmaßnahmen für Hinweisgeber

Änderung von KI unter dem EU AI Act: Praktische Lektionen zu Klassifizierung und Compliance

Lumi AI News

Rechtliches

Themenbereiche