NatureBench: Wie weit Coding-Agenten in wissenschaftlichen Aufgaben wirklich kommen24. June 202624. June 2026AI Models, Claude AI, Claude CodeKI-Agenten übertreffen Baseline auf nur knapp 18 Prozent echter wissenschaftlicher Aufgaben, weil sie Probleme eher neu rahmen als wirklich innovativ lösen. Share on: