InfoKV: Entropie-basierte KV-Cache-Kompression für lange Reasoning-Sequenzen26. June 202626. June 2026AI Models, Claude CodeInfoKV kombiniert Attention-Scores mit Unsicherheitssignalen zur KV-Cache-Kompression und übertrifft damit reine Attention-basierte Methoden bei langem Reasoning um messbare Margen. Share on: