OpenBioRQ: Benchmark für Agentic-KI-Modelle in biomedizinischen Forschungsfragen26. June 202626. June 2026AI Models, Claude AI, Claude CodeKI-Agenten geben weniger oft nicht existierende Quellen an, verlinken aber in 15,9% der Fälle auf falsche Papers, und stoppen bei schwierigen Fragen die Tool-Nutzung genau dort, wo diese am kritischsten wäre. Share on: