UUSAsünkroonne torujada-paralleelne töötlemine LLM-eelkoolitusele gradiendi viivituse korral praktikajärgne

30. June 2026
Claude Code, Tehisintellekti mudelid

Asünkroonne torujada-paralleelne töötlemine koos PipeDream-2BW ja uuemate optimeerijatega ületab gradiendi aegunud probleemi ja võimaldab tõhusa suure keelemudelis eelkoolitust ilma GPU-i jõude ajata.

Share on:

UUSVision-AI-agendid: sünteetilised andmed ja täpsustamine parema täpsuse saavutamiseks

30. June 2026
Claude Code, Tehisintellekti mudelid

Vision-AI-agendid vajavad süstemaatilisi lähenemisi andmete sünteseerimiseks ja mudelite täpsustamiseks, et tuvastada haruldasi juhtumeid ja kohaneda kohalike tingimustega.

Share on:

Ornith-1.0: avatud lähtekoodiga mudel agendi-juhitavate tarkvara arenduse jaoks

29. June 2026
Claude Code, Tehisintellekti mudelid

Ornith-1.0 pakub agendi-juhitavaid võimalusi koodi ülesannete jaoks suuruste 9B, 31B, 35B MoE ja 397B MoE variantides, saavutades võrreldava suuruse juures tipptasemel jõudluse kodeerimise etalonides.

Share on:

Kohalikud keelemudelid rakendusesse integreerimine: Ollamast kuni toodangukoodini

28. June 2026
Claude Code, Tehisintellekti mudelid

Kohalike avatud lähtekoodiga LLM-ide kvaliteet sõltub vähem mudelist kui pigem koodikvalitest, veakaitsest ja API-integratsioonist mudeli päringute ümbruses.

Share on:

InfoKV: Entroopia-põhine KV-vahemälu tihendamine pikade järeldamisjadade jaoks

26. June 2026
Claude Code, Tehisintellekti mudelid

InfoKV ühendab tähelepanu-skoorid ebakindlusesignaalidega KV-vahemälu tihendamiseks, ületades puhta tähelepanu-põhise meetodid pikka järeldamist tehes mõõdetavate marjide võrra.

Share on:

JetSpec: paralleelne puu-draftimine lahendab pudelikaela spekulatiivses dekodeerimises

26. June 2026
Claude AI, Tehisintellekti mudelid

JetSpec ületab spekulatiivse dekodeerimise skaleeritavuse piiranguid paralleelse puu-draftimisega ja kausaalse tingimustusvõimega, saavutades kuni 9,64x kiirenduse LLM-inferentsis.

Share on:

OpenBioRQ: agendiõhuline biomeditsiinitaotluste võrdlusmõõt

26. June 2026
Claude AI, Claude Code, Tehisintellekti mudelid

OpenBioRQ näitab, et agentpõhised KI-mudelid ebaõnnestuvad umbes 40% juures keeruliste biomeditsiinitaotluste puhul ja just raskete ülesannete puhul jätavad vahendite kasutamise, kuigi need oleksid kõige olulisemad.

Share on:

ViQ: diskreetsed visuaalsed kujutised suvaliste resolutsioonidega

26. June 2026
Claude Code, Tehisintellekti mudelid

ViQ kvantiseerib visuaalseid sisendeid suvaliste resolutsioonidega diskreetseteks esitusteks ja saavutab seejuures 20–70% treeningu kiirendust võrreldes pideva pildikooderinguga.

Share on:

Tööriista kutsumise rikked skeemipiirangute korral avatud kaaluga LLM-ides

26. June 2026
Claude Code, Tehisintellekti mudelid

JSON-skeemipiirangud kompileerivad tööriista kutsumiste tokened märgiruum märkideks, millele mudelid funktsiooni kutsumisi summutavad, kuigi mõlemad funktsioonid eraldi töötavad.

Share on:

UUSAsünkroonne torujada-paralleelne töötlemine LLM-eelkoolitusele gradiendi viivituse korral praktikajärgne

UUSVision-AI-agendid: sünteetilised andmed ja täpsustamine parema täpsuse saavutamiseks

Ornith-1.0: avatud lähtekoodiga mudel agendi-juhitavate tarkvara arenduse jaoks

Kohalikud keelemudelid rakendusesse integreerimine: Ollamast kuni toodangukoodini

InfoKV: Entroopia-põhine KV-vahemälu tihendamine pikade järeldamisjadade jaoks

JetSpec: paralleelne puu-draftimine lahendab pudelikaela spekulatiivses dekodeerimises

OpenBioRQ: agendiõhuline biomeditsiinitaotluste võrdlusmõõt

ViQ: diskreetsed visuaalsed kujutised suvaliste resolutsioonidega

Tööriista kutsumise rikked skeemipiirangute korral avatud kaaluga LLM-ides

Lumi AI News

Õiguslik

Teemavaldkonnad