Skip to content

Keeleainesäästud LLM-ides: väljund vähendab kulusid, sisend suurendab neid

Lühidalt: Väljundi ainesäästud vähendavad järeldamise kulusid 1,4–3x võrra, sisendi ainesäästud suurendavad neid keskmiselt 1,15x võrra, kuna mudelid reageerivad ebatäpsele sõnakulule pikkamaid vastustega.

Uurimus näitab, et lihtsustatud sisendkäsud („Räägi lühidalt, ilma grammatikuta”) suurte keemudelite puhul ei vähenda kulusid, vaid suurendavad neid — samas kui väljundi ainesäästud on tõhusad.

Hindamisprotokoll “Cavewoman” uuris süstemaatiliselt, kuidas kaheksa LLM-i reageerivad keeleainesäästudele kahel kanalis: sisendkäsud ja genereeritud väljund. Teadlased testisid viit ainesäästutaset viiel andmestikul ja jälgisid ülesande täpsust, tegelikke kulusid elemendi kohta ning semantilist vastavust tihendamata referentsväljaandega.

Väljundi ainesäästud — ehk käsk anda lühemate vastuste — vähendavad teostunud kulusid enamiku API-mudelite puhul 1,4–2,4x võrra mudeli kohta, optimaalsetel juhtudel kuni 3x. Kõik neli testitud avatud kaaluga mudelit näitasid kulude kokkuhoidu ka avalike hinnakujundusmudelite alusel. Sisendi ainesäästul on aga vastupidine mõju: mudelid genereerivad kompensatsioonis ebatäpsusele pikemaid vastuseid ja suurendavad seega netokulusid keskmiselt 1,15x võrra — halvimasel juhul 1,8x, agressiivsel tihendamisel isegi 2,7x — samal ajal kui ülesande täpsus väheneb.

Lisaks näitab analüüs semantilist probleemi: mitte-järeldamise mudelite puhul erinevad umbes pool kõigist tihendatud genereeringutest pealiskaudselt tihendamata lähteandmest, kuigi nad lahendavad ülesande formaalse poolest ikkagi. See lahknevus püsib ka pikkuse normaliseerimise, statistilise paranduse ja alternatiivse semantika meetrika valideerimise järel.


Allikas: arxiv.org · Avaldatud 22. juuni 2026
Lumi AI News — tehisintellekti abil kurateeritud vastavalt EU AI Akti art. 50. Parafraas ja klassifitseerimine Lumi News Pipeline v1.7.1 kaudu.

Share on: