Kokkuvõttes: KI-agendeid saab treenida andmeteadlastena, et automatiseeritult genereerida kvaliteetseid sünteetilisi treeniandmeid, mille omadused paranevad jätkuvalt meta-optimeerimise kaudu.

Teadlased on välja töötanud Autodatad, meetodi, mis kasutab KI-agente andmeteadlastena kõrgekvaliteetiliste sünteetiliste treeni- ja hindamisandmete loomiseks. Meetodit saab meta-optimeerimise abil ise treenida ja see annab paremaid tulemusi kui klassikalised andmete loomise meetodid.

Autodata rakendab strateegiat nimega “Agentic Self-Instruct”, mille puhul KI-agendid süstemaatiliselt konstrueerivad treeniandmeid. Lähenemisviis asendab käsitsi või poolautomaatse andmete inseneria agentiga juhitud struktuuriga, mis iteratiivselt õpib, millised andmete omadused paremaks mudelite tulemuslikkuseks viivad.

Meetodit testiti kolme erineval kasutamise juhul: tarkvaraarenduse ülesanded arvutiteadusest, juriidiline arutelu ja matemaatilised probleemide lahendamine. Kõigis stsenaariumites ületas Autodata klassikalisi sünteetiliste andmete genereerimise tehnikaid. Lisaks andis andmeteadlase-agendi enda meta-optimeerimine täiendavaid jõudluse kasve – süsteem muutub paremaks parema andmete loomises.

CTO-dele ja andmete arhitektoritele asjakohane: Meetod muundab suurenenud inferentsi arvutuse võimsuse otse paremateks treeniandmeteks. Selle asemel, et investeerida täiendavat arvutust mudelite treenimisesse, saab see voolata andmete genereerimisesse. See avab uue optimeerimisparameetri treeni-infrastruktuuri skaleerimisel ja võib muuta viisi, kuidas ML-meeskondad treeniandmeid konstrueerivad ja itereerivad.

Allikas: arxiv.org · Avaldatud 23. juunil 2026
Lumi AI News — KI-abil kurateeritud kooskõlas EU AI Act artikliga 50. Parafraas ja klassifikatsioon Lumi News Pipeline v1.7.1 kaudu.

Share on:

Autodata: KI-agendid kui automatiseeritud andmeteadlased treeniandmete jaoks

Lumi AI News

Õiguslik

Teemavaldkonnad