Anthropic-Studie: KI-Assistenten verschärfen Kompetenzlücken bei Edge Cases

10. June 202610. June 2026
Claude AI, Claude Code

KI-Assistenten steigern Standardaufgaben-Geschwindigkeit, erzeugen aber messbare Defizite beim eigenständigen Problemlösen in komplexen oder unvorhergesehenen Fällen.

Share on:

Hybride LLMs verlieren Long-Context-Fähigkeiten durch CoT-Feintuning

10. June 202610. June 2026
AI Models, Claude Code

CoT-Feintuning degradiert Long-Context-Retrieval in hybriden LLMs durch Verzerrung der Query-Key-Projektionen; QK-Restore behebt dies ohne zusätzliches Training.

Share on:

Claude Security ermöglicht Code-Scanning mit Opus 4.7 auf unternehmenseigenen Codebasen

10. June 202610. June 2026
Anthropic, Claude Code, Cybersecurity

Claude Security auf Basis von Opus 4.7 erlaubt Unternehmen, KI-gestützte Codeanalyse eigenverantwortlich auf ihren Codebasen auszuführen.

Share on:

FlowTracer: Gezieltes Reinforcement Learning durch Nachverfolgung von Informationsfluss in LLMs

10. June 202610. June 2026
AI Models, Claude AI, Claude Code

FlowTracer modelliert Informationspropagation als gerichteten Graphen und leitet Token-Credits aus globaler Flussstruktur ab, um Reinforcement-Learning-Signale präzise auf entscheidende Reasoning-Schritte zu konzentrieren.

Share on:

FlowTracer: Gezielte Reinforcement-Learning in LLMs durch Attention-basierte Informationsflussverfolgung

10. June 202610. June 2026
AI Models, Claude Code, Claude Cowork

FlowTracer weist Tokens Credit basierend auf ihrem gemessenen Informationsdurchsatz im Attention-Graphen zu statt alle gleich zu behandeln, was konsistente Leistungsgewinne bei Reasoning-Aufgaben bringt.

Share on:

Unternehmen deployen massenhaft verwundbare KI-generierte Software

10. June 202610. June 2026
Claude Code, Cybersecurity

Unternehmen wissen, dass KI-generierter Code sicherheitskritische Lücken enthält, deployen ihn aber massenhaft und teilweise absichtlich ohne Fixes.

Share on:

PACT: Effizientere Kommunikation in Multi-Agent-Systemen mit Claude

10. June 202610. June 2026
AI Models, Claude Code

Strukturierte, handlungsorientierte Agenten-Kommunikation (PACT) senkt Token-Kosten in Multi-Agent-Systemen ohne Performance-Einbußen.

Share on:

Workflow-GYM: Benchmark offenbart Grenzen von KI-Agenten bei komplexen GUI-Aufgaben

10. June 202610. June 2026
AI Models, Claude Code, Claude Cowork

Aktuelle KI-Agenten können langfristige, professionelle GUI-Workflows nicht zuverlässig ausführen und scheitern an Konsistenzerhalt, Fehlerausbreitung und domänenspezifischem Verständnis.

Share on:

Lookahead Sparse Attention: DeepSeek-V4 reduziert KV-Cache auf 13,5 Prozent

9. June 202610. June 2026
AI Models, Claude Code

LSA prognostiziert relevante Kontextabschnitte vorab und behält nur diese im GPU-Speicher, wodurch der KV-Cache um über 86 Prozent komprimiert wird, ohne die Genauigkeit zu opfern.

Share on:

Latent Context Language Models: Skalierbare KV-Cache-Kompression für lange Kontexte

9. June 202610. June 2026
AI Models, Claude Code

LCLMs komprimieren KV-Caches durch Encoder-Decoder-Architektur bis 1:16 effizienter als bisherige Verfahren und reduzieren dabei Peak-Memory-Auslastung und Verarbeitungszeit.

Share on:

Encoder-Decoder-Architektur für effiziente Kontext-Kompression in LLMs

9. June 202610. June 2026
AI Models, Claude Code

Encoder-Decoder-Kompressoren mit adaptiver Expansion verbessern KV-Cache-Kompressionsmethoden in Geschwindigkeit und Speichereffizienz, ohne nennenswerte Qualitätsverluste.

Share on:

Adversarische Hacker-Fixer-Schleifen schließen Sicherheitslücken in Agent-Benchmarks

9. June 202610. June 2026
AI Models, Claude Code

Ein automatisiertes System aus konkurrierenden KI-Agenten findet und schließt iterativ Exploits in Agent-Benchmarks, ohne manuelle Per-Task-Patches zu erfordern.

Share on:

« Previous
1
…
6
7
8
9
10
…
18
Next »

Anthropic-Studie: KI-Assistenten verschärfen Kompetenzlücken bei Edge Cases

Hybride LLMs verlieren Long-Context-Fähigkeiten durch CoT-Feintuning

Claude Security ermöglicht Code-Scanning mit Opus 4.7 auf unternehmenseigenen Codebasen

FlowTracer: Gezieltes Reinforcement Learning durch Nachverfolgung von Informationsfluss in LLMs

FlowTracer: Gezielte Reinforcement-Learning in LLMs durch Attention-basierte Informationsflussverfolgung

Unternehmen deployen massenhaft verwundbare KI-generierte Software

PACT: Effizientere Kommunikation in Multi-Agent-Systemen mit Claude

Workflow-GYM: Benchmark offenbart Grenzen von KI-Agenten bei komplexen GUI-Aufgaben

Lookahead Sparse Attention: DeepSeek-V4 reduziert KV-Cache auf 13,5 Prozent

Latent Context Language Models: Skalierbare KV-Cache-Kompression für lange Kontexte

Encoder-Decoder-Architektur für effiziente Kontext-Kompression in LLMs

Adversarische Hacker-Fixer-Schleifen schließen Sicherheitslücken in Agent-Benchmarks

Lumi AI News

Rechtliches

Themenbereiche