Latent Context Language Models: Skalierbare KV-Cache-Kompression für lange Kontexte9. June 202610. June 2026AI Models, Claude CodeLCLMs komprimieren KV-Caches durch Encoder-Decoder-Architektur bis 1:16 effizienter als bisherige Verfahren und reduzieren dabei Peak-Memory-Auslastung und Verarbeitungszeit. Share on: