OpenBioRQ: Benchmark für Agentic-KI-Modelle in biomedizinischen Forschungsfragen

26. June 202626. June 2026
AI Models, Claude AI, Claude Code

KI-Agenten geben weniger oft nicht existierende Quellen an, verlinken aber in 15,9% der Fälle auf falsche Papers, und stoppen bei schwierigen Fragen die Tool-Nutzung genau dort, wo diese am kritischsten wäre.

Share on:

OpenBioRQ: Benchmark für Agentic-KI-Modelle in biomedizinischen Forschungsfragen

Lumi AI News

Rechtliches

Themenbereiche