NatureBench: Wie weit Coding-Agenten in wissenschaftlichen Aufgaben wirklich kommen

24. June 202624. June 2026
AI Models, Claude AI, Claude Code

KI-Agenten übertreffen Baseline auf nur knapp 18 Prozent echter wissenschaftlicher Aufgaben, weil sie Probleme eher neu rahmen als wirklich innovativ lösen.

Share on:

NatureBench: Wie weit Coding-Agenten in wissenschaftlichen Aufgaben wirklich kommen

Lumi AI News

Rechtliches

Themenbereiche