OpenBioRQ: Benchmark für agentenbasierte biomedizinische Forschungsfragen26. June 202626. June 2026AI Models, Claude AI, Claude CodeOpenBioRQ zeigt, dass agentenbasierte KI-Modelle bei komplexen biomedizinischen Forschungsfragen bei etwa 40% versagen und gerade bei schwierigen Aufgaben ihre Werkzeuge nicht mehr einsetzen, obwohl diese am wichtigsten wären. Share on: