Is CHATGPT ready for primetime?
Performance of artificial intelligence on a simulated Canadian urology board exam
DOI :
https://doi.org/10.5489/cuaj.8800Mots-clés :
Artificial Intelligence, ChatGPT, Assessments, Urology Exams, Medical EducationRésumé
INTRODUCTION: Generative artificial intelligence (AI) has proven to be a powerful tool with increasing applications in clinical care and medical education. ChatGPT has performed adequately on many specialty certification and knowledge assessment exams. The objective of this study was to assess the performance of ChatGPT 4 on a multiple-choice exam meant to simulate the Canadian urology board exam.
METHODS: Graduating urology residents representing all Canadian training programs gather yearly for a mock exam that simulates their upcoming board-certifying exam. The exam consists of written multiple-choice questions (MCQs) and an oral objective structured clinical examination (OSCE). The 2022 exam was taken by 29 graduating residents and was administered to ChatGPT 4.
RESULTS: ChatGPT 4 scored 46% on the MCQ exam, whereas the mean and median scores of graduating urology residents were 62.6%, and 62.7%, respectively. This would place ChatGPT’s score 1.8 standard deviations from the median. The percentile rank of ChatGPT would be in the sixth percentile. ChatGPT scores on different topics of the exam were as follows: oncology 35%, andrology/benign prostatic hyperplasia 62%, physiology/anatomy 67%, incontinence/female urology 23%, infections 71%, urolithiasis 57%, and trauma/reconstruction 17%, with ChatGPT 4’s oncology performance being significantly below that of postgraduate year 5 residents.
CONCLUSIONS: ChatGPT 4 underperforms on an MCQ exam meant to simulate the Canadian board exam. Ongoing assessments of the capability of generative AI is needed as these models evolve and are trained on additional urology content.
Téléchargements
Téléchargements
Publié-e
Comment citer
Numéro
Rubrique
Licence
Les auteurs accordent les droits d’auteurs liés à l’article et son contenu à l’Association des urologues du Canada. Cette entente signifie que vous ne pouvez pas faire ce qui suit, sans d’abord obtenir l’autorisation écrite de l’AUC :
- Afficher l’article sur tout site Web.
- Traduire ou autoriser une tierce partie à traduire l’article.
- Copier ou reproduire l’article par quelque moyen que ce soit et sous tout format que ce soit, ou autoriser d’autres à le faire, au-delà de ce qui est permis par la loi canadienne du droit d’auteur.
- Copier ou reproduire des sections de l’article, y compris les tableaux et figures, par quelque moyen que ce soit, ou autoriser d’autres à le faire, au-delà de ce qui est permis par la loi canadienne du droit d’auteur.
L’AUC encourage l’usage des articles à des fins éducatives sans but commercial et ne refusera pas sans motif raisonnable toute demande d’autorisation à cet effet.
Vous conservez le droit moral lié à l’article et son contenu. Cela signifie que l’AUC ne peut utiliser ses droits d’auteurs d’une manière telle que cela pourrait avoir des répercussions négatives sur votre réputation ou sur votre droit à être associé à l’article.
L’AUC exige également que vous garantissiez ce qui suit :
- Vous êtes l’auteur ou les auteurs et seul(s) propriétaire(s) du contenu, le contenu de l’article est original et n’a jamais été publié et vous n’en avez pas déjà cédé les droits d’auteurs ni accordé de licence concernant son contenu à toute autre tierce partie;
- Toutes les personnes qui ont contribué de manière considérable à la rédaction de l’article sont mentionnées;
- L’article ne viole aucun droit de propriété de toute tierce partie, et vous avez obtenu les autorisations requises pour inclure les travaux d’autres personnes dans cet article; et
- L’article ne diffame aucune tierce partie ni ne viole les droits à la vie privée de toute tierce partie.
