Kokkuvõte: 35B-agendi mudel horisontaalse skaleerimise ja mitme õpetaja destillatsiooniga saavutab võrreldavat jõudlust triljoni parameetriga mudelitega pikaajaliste ülesannete standardtestidel.
Uurijad on välja arendanud Agents-A1, 35 miljardi parameetriga ekspertide segude mudeli, mis konkureerib triljoni parameetriga süsteemidega pikaajaliste ülesannete puhul. Lähenemine ei skaleeeri parameetrite arvu, vaid agendi toimingute keerukust ja pikkust.
Agents-A1 kasutab ekspertide segude arhitektuuri ja skaleerib agendi toiminguid kahel dimensioonil: pikkade trajektooride (keskmiselt 45 000 tokenit järjestuse kohta) ja heterogeensete võimaluste üle kuues erinevates valdkondades. Infrastruktuur ühendab väliseid teadusallikaid, toiminguid, jälgimisi ja verifikaatori väljundeid sidusateks agendi järjestusteks.
Treening järgib kolmeosalist retsepti: kõigepealt Full-Domain Supervised Fine-Tuning, et joondada lai agendi käitumine, seejärel domeenikohased õpetaja mudelid spetsialiseeritud teadmiste saamiseks, lõpuks Multi-Teacher Domain-Routed On-Policy Destillatsioon Salient-Vocabulary-Alignment’iga teadmiste ülekandepaigalduse parandamiseks domeenide vahel.
Etableeritud pikaajaliste ülesannete standardtestidel ületab või saavutab Agents-A1 süsteemide, näiteks Kimi-K2.6 ja DeepSeek-V4-pro, jõudluse: SEAL-0 (56,4), IFBench (80,6), HiPhO (46,4), FrontierScience-Olympiad (79,0) ja MolBench-Bind (56,8). SciCode’il (44,3), HLE’l (47,6) ja BrowseComp’il (75,5) jääb mudel väga konkurentsivõimeliseks.
CTO-de jaoks tähendab see lähenemine praktikalist alternatiivi triljoni parameetriga mudelitele: väiksemad, spetsialiseeritud agendid, kus on laiendatud horisontaalse võimalusega, võimaldavad kuluefektiivsust järeldustes, kasutusele võtmises ja finetuningus, samal ajal kui nad annavad keeruliste mitmesammuliste ülesannete puhul võrreldavaid tulemusi.
Allikas: arxiv.org · Avaldatud 28. juuni 2026
Lumi AI News — KI-abil kurateeritud vastavalt EU AI Act’i artiklile 50. Parafraas ja klassifikatsioon Lumi News Pipeline v1.7.2 kaudu.