ICALens: Interpretierbarkeitsmethode für Sprachmodelle ohne Training zusätzlicher Autoencodern

11. June 202611. June 2026
AI Models, Claude AI

ICA-basierte Analyse ermöglicht schnelle Exploration interpretierbarer Richtungen in Sprachmodellen ohne aufwendiges Training zusätzlicher Autoencodern.

Share on:

Google DeepMind DiffusionGemma: parallele Textgenerierung auf lokalen GPUs

10. June 202610. June 2026
AI Models, Google

DiffusionGemma denoisiiert bis zu 256 Token parallel pro Schritt statt einzeln und erreicht auf NVIDIA H100 1.000 Token/Sekunde bei Batch-Size 1 — ohne Cloud-Abhängigkeit.

Share on:

DiffusionGemma: Diffusionsbasierte Text-Generierung statt Token-für-Token-Ansatz

10. June 202610. June 2026
AI Models, Claude AI

DiffusionGemma ersetzt das traditionelle sequenzielle Token-Generierungsverfahren durch parallele Denoisierung von 256-Token-Blöcken, was schnellere Inferenz und bessere Problemlösungsfähigkeiten bei komplexen Aufgaben ermöglicht.

Share on:

KI-Assistenz und Low-Code: Komplementäre Ansätze statt Konkurrenz

10. June 202610. June 2026
Claude AI, Claude Code

KI-Tools sind Assistenzwerkzeuge mit Transparenzlücken und Halluzinations-Risiken, während Low-Code durch strukturierte, auditierbare Bausteine Komplexität reduziert – beide können komplementär wirken.

Share on:

Hybride LLMs verlieren Long-Context-Fähigkeiten durch CoT-Feintuning

10. June 202610. June 2026
AI Models, Claude Code

CoT-Feintuning degradiert Long-Context-Retrieval in hybriden LLMs durch Verzerrung der Query-Key-Projektionen; QK-Restore behebt dies ohne zusätzliches Training.

Share on:

FlowTracer: Gezielte Reinforcement-Learning in LLMs durch Attention-basierte Informationsflussverfolgung

10. June 202610. June 2026
AI Models, Claude Code, Claude Cowork

FlowTracer weist Tokens Credit basierend auf ihrem gemessenen Informationsdurchsatz im Attention-Graphen zu statt alle gleich zu behandeln, was konsistente Leistungsgewinne bei Reasoning-Aufgaben bringt.

Share on:

PACT: Effizientere Kommunikation in Multi-Agent-Systemen mit Claude

10. June 202610. June 2026
AI Models, Claude Code

Strukturierte, handlungsorientierte Agenten-Kommunikation (PACT) senkt Token-Kosten in Multi-Agent-Systemen ohne Performance-Einbußen.

Share on:

ARM: Autoregressive Modell für einheitliche Bild- und Textverarbeitung

10. June 202610. June 2026
AI Models

ARM kombiniert diskrete visuelle Token mit einem 7-Milliarden-Parameter-Modell, um Bild- und Texttasks einheitlich als Token-Vorhersagen zu lösen.

Share on:

Latent Context Language Models: Skalierbare KV-Cache-Kompression für lange Kontexte

9. June 202610. June 2026
AI Models, Claude Code

LCLMs komprimieren KV-Caches durch Encoder-Decoder-Architektur bis 1:16 effizienter als bisherige Verfahren und reduzieren dabei Peak-Memory-Auslastung und Verarbeitungszeit.

Share on:

Encoder-Decoder-Architektur für effiziente Kontext-Kompression in LLMs

9. June 202610. June 2026
AI Models, Claude Code

Encoder-Decoder-Kompressoren mit adaptiver Expansion verbessern KV-Cache-Kompressionsmethoden in Geschwindigkeit und Speichereffizienz, ohne nennenswerte Qualitätsverluste.

Share on:

Adversarische Hacker-Fixer-Schleifen schließen Sicherheitslücken in Agent-Benchmarks

9. June 202610. June 2026
AI Models, Claude Code

Ein automatisiertes System aus konkurrierenden KI-Agenten findet und schließt iterativ Exploits in Agent-Benchmarks, ohne manuelle Per-Task-Patches zu erfordern.

Share on:

Claude Code 2.1.170: Fable-5-Modell verfügbar, Session-Speicher korrigiert

9. June 20269. June 2026
Anthropic, Claude AI

Claude Fable 5 (Mythos-Klasse) ist ab Claude Code 2.1.170 einsatzbereit; ein Session-Speicher-Bug beim Start aus VS Code wurde behoben.

Share on:

« Previous
1
2
3
4
5
6
…
38
Next »

ICALens: Interpretierbarkeitsmethode für Sprachmodelle ohne Training zusätzlicher Autoencodern

Google DeepMind DiffusionGemma: parallele Textgenerierung auf lokalen GPUs

DiffusionGemma: Diffusionsbasierte Text-Generierung statt Token-für-Token-Ansatz

KI-Assistenz und Low-Code: Komplementäre Ansätze statt Konkurrenz

Hybride LLMs verlieren Long-Context-Fähigkeiten durch CoT-Feintuning

FlowTracer: Gezielte Reinforcement-Learning in LLMs durch Attention-basierte Informationsflussverfolgung

PACT: Effizientere Kommunikation in Multi-Agent-Systemen mit Claude

ARM: Autoregressive Modell für einheitliche Bild- und Textverarbeitung

Latent Context Language Models: Skalierbare KV-Cache-Kompression für lange Kontexte

Encoder-Decoder-Architektur für effiziente Kontext-Kompression in LLMs

Adversarische Hacker-Fixer-Schleifen schließen Sicherheitslücken in Agent-Benchmarks

Claude Code 2.1.170: Fable-5-Modell verfügbar, Session-Speicher korrigiert

Lumi AI News

Rechtliches

Themenbereiche