Meistzitierte Publikationen im Bereich Gesundheit & MedTech
\$OneMillion-Bench: How Far are Language Agents from Human Experts?
2026 · 0 Zit. · Open MIND
2026 · 0 Zit. · ArXiv.org
Xpertbench: Expert Level Tasks with Rubrics-Based Evaluation
2026 · 0 Zit. · arXiv (Cornell University)