InfoKV: Entroopia-põhine KV-vahemälu tihendamine pikade järeldamisjadade jaoks26. June 2026Claude Code, Tehisintellekti mudelidInfoKV ühendab tähelepanu-skoorid ebakindlusesignaalidega KV-vahemälu tihendamiseks, ületades puhta tähelepanu-põhise meetodid pikka järeldamist tehes mõõdetavate marjide võrra. Share on:
Keelekokkusurumine LLM-ides: väljundi optimeerimine kokkuhoiu, sisendi vähendamine kulude suurendamiseks26. June 2026Claude Code, Tehisintellekti mudelidVäljundi kokkusurumine vähendab tõhusalt järeldamise kulusid, kuid sisendi kokkusurumine suurendab kogukulusid ja halvendab vastuste kvaliteeti. Share on: