InfoKV: Entropie-basierte KV-Cache-Kompression für lange Reasoning-Sequenzen

26. June 202626. June 2026
AI Models, Claude Code

InfoKV kombiniert Attention-Scores mit Unsicherheitssignalen zur KV-Cache-Kompression und übertrifft damit reine Attention-basierte Methoden bei langem Reasoning um messbare Margen.

Share on:

SEVRA: Selektive Verifikation für effizientere KI-Reasoning bei Inferenzzeit

19. June 202619. June 2026
AI Models

SEVRA spart beim Inferenzen durch selektive Verifikation 26–91 Prozent Tokens ein, ohne die Genauigkeit zu beeinträchtigen, stellt aber längere initiale Lösungsversuche als teilweise kostengünstiger dar.

Share on:

ClinHallu: Benchmark zur Diagnose von Halluzinationen in medizinischen KI-Modellen

15. June 202615. June 2026
AI Models, Claude Code

Ein neuer Benchmark ermöglicht es, die exakte Stelle zu identifizieren, wo medizinische KI-Modelle Halluzinationen produzieren, und gezielt durch Trace-Supervised Fine-Tuning gegenzusteuern.

Share on:

Microsoft präsentiert sieben MAI-Modelle mit Fokus auf Reasoning und Enterprise-Einsatz

3. June 20263. June 2026
AI Models, Google, Google Gemini

Microsoft hat mit MAI-Thinking-1 sein erstes Reasoning-Modell mit Fine-Tuning-Kapabilität für Enterprise vorgestellt, das speziell auf Domain-spezifische Anpassungen ausgerichtet ist.

Share on:

InfoKV: Entropie-basierte KV-Cache-Kompression für lange Reasoning-Sequenzen

SEVRA: Selektive Verifikation für effizientere KI-Reasoning bei Inferenzzeit

ClinHallu: Benchmark zur Diagnose von Halluzinationen in medizinischen KI-Modellen

Microsoft präsentiert sieben MAI-Modelle mit Fokus auf Reasoning und Enterprise-Einsatz

Lumi AI News

Rechtliches

Themenbereiche