iLLaDA: 8B-keelne mudel, mis on treenitud kahesuunalise difusiooniga

26. June 2026
Tehisintellekti mudelid

iLLaDA näitab, et täielikult kahesuunaline difusioonitreening algusest peale on konkurentsivõimeline viis võimsate keelemudelite saavutamiseks ka ilma autoregressiivse treenimiseta.

Share on:

NVIDIA Blackwell Amazon SageMakeris: Mälu ja täpsus suurematele mudelitele

25. June 2026
Google, Tehisintellekti mudelid

Blackwelli 180–268 GB mälu GPU kohta võimaldab suuremaid pakke ja pikemaid järjestusi mudeli treenimise ajal, vähendades kommunikatsioonikoormat ja võimaldades ühes sõlmes treenimist mudelitele, mis varem nõudsid mitme sõlmega seadistusi.

Share on:

iLLaDA: 8B-keelne mudel, mis on treenitud kahesuunalise difusiooniga

NVIDIA Blackwell Amazon SageMakeris: Mälu ja täpsus suurematele mudelitele

Lumi AI News

Õiguslik

Teemavaldkonnad