OpenAlex · Aktualisierung stündlich · Letzte Aktualisierung: 27.05.2026, 02:53

Dies ist eine Übersichtsseite mit Metadaten zu dieser wissenschaftlichen Arbeit. Der vollständige Artikel ist beim Verlag verfügbar.

Evaluation of Reliability, Repeatability, Robustness, and Confidence of GPT-3.5 and GPT-4 on a Radiology Board–style Examination

2024·70 Zitationen·Radiology
Volltext beim Verlag öffnen

70

Zitationen

4

Autoren

2024

Jahr

Abstract

Default GPT-3.5 and GPT-4 were reliably accurate over three attempts at answering radiology board–style multiple-choice questions but had poor repeatability and robustness and were frequently overconfident, limiting usability without domain-specific optimization.

Ähnliche Arbeiten