GauntletBench: Neue Messlatte zeigt Grenzen von KI-Agenten auf26. June 202626. June 2026AI Models, Claude Code, Claude CoworkAktuelle KI-Agenten scheitern bei komplexen visuellen Aufgaben in professionellen Anwendungen deutlich häufiger als bisherige Benchmarks suggerieren. Share on: