GauntletBench: Uus mõõdustik näitab AI-agentide piiranguid26. June 2026Claude Code, Claude Cowork, Tehisintellekti mudelidPraegused AI-agendid ei suuda komplekseid visuaalseid ülesandeid professionaalsetes rakendustes lahendada palju enam kui varasemad testid näitaksid. Share on: