OpenBioRQ: Benchmark für agentenbasierte biomedizinische Forschungsfragen

26. June 202626. June 2026
AI Models, Claude AI, Claude Code

OpenBioRQ zeigt, dass agentenbasierte KI-Modelle bei komplexen biomedizinischen Forschungsfragen bei etwa 40% versagen und gerade bei schwierigen Aufgaben ihre Werkzeuge nicht mehr einsetzen, obwohl diese am wichtigsten wären.

Share on:

OpenThoughts-Agent: Systematische Daten-Kurierung für Agentic-Modelle

24. June 202624. June 2026
AI Models, Claude AI

Eine systematische Daten-Kurierungs-Pipeline ermöglicht es, Agentic-Modelle über vielfältige Aufgabentypen generalisierbar zu trainieren und dabei konkurrenzfähige oder bessere Ergebnisse zu erzielen als spezialisierte Modelle.

Share on:

OpenBioRQ: Benchmark für agentenbasierte biomedizinische Forschungsfragen

OpenThoughts-Agent: Systematische Daten-Kurierung für Agentic-Modelle

Lumi AI News

Rechtliches

Themenbereiche