Evaluation of ChatGPT’s performance on answering pediatric urology questions based on association guidelines

Wyatt MacNevin; Nicholas Dawe; Laura Harkness; Budoor Salman; Daniel T. Keefe

doi:10.5489/cuaj.9238

Evaluation of ChatGPT’s performance on answering pediatric urology questions based on association guidelines

Auteurs-es

Wyatt MacNevin Dalhousie Medical School
Nicholas Dawe Dalhousie University, Faculty of Medicine
Laura Harkness Dalhousie University, Faculty of Medicine
Budoor Salman Dalhousie University, Department of Urology, Halifax, Nova Scotia, Canada
Daniel T. Keefe Dalhousie University, Department of Urology and Pediatric Urology, Halifax, Nova Scotia, Canada

DOI :

https://doi.org/10.5489/cuaj.9238

Mots-clés :

ChatGPT, Artificial Intelligence, Pediatric Urology, Medical Information, Patient Knowledge

Résumé

INTRODUCTION: ChatGPT has been shown to provide accurate and complete responses to clinically focused questions, although its ability to successfully answer common pediatric urology-based questions remains unexplored. Furthermore, the concordance of ChatGPT’s answers with association recommendations has yet to be analyzed.

METHODS: A list of common pediatric urology questions of varying difficulty was developed in association with publicly available guidelines and resources from the Canadian Urological Association (CUA), American Urological Association (AUA), and the European Association of Urology (EAU). Questions were administered individually using three separate functions, and responses were evaluated for comprehensiveness and accuracy using a Likert scale. Descriptive statistics and analysis of variance were used for statistical analysis.

RESULTS: ChatGPT performed best in the domain of phimosis (mean ± standard deviation: 2.32/3.00±0.57) and VUR (2.11/3.00±0.63), and worst in acute scrotal pathology (1.90/3.00±0.58) and cryptorchidism (1.92/3.00±0.56) (p=0.031). “Easy” questions (2.31/3.00±0.09) had greater comprehensiveness scores compared to “medium” (1.92/3.00±0.07, p=0.003) and “difficult” questions (1.86/3.00±0.101, p=0.003). Definition-based questions had greater comprehensiveness scores across all guidelines. ChatGPT was more accurate and in concordance with EAU-based information (2.10±0.41) compared to AUA (1.95±0.41, p=0.04).

CONCLUSIONS: ChatGPT answered questions with high levels of appropriateness and comprehensiveness. ChatGPT performed best in the areas of phimosis and VUR and worst in acute scrotal pathology. While ChatGPT performed well across all question domains, it performed best when referenced to EAU and CUA compared to AUA.

Téléchargements

Les données relatives au téléchargement ne sont pas encore disponibles.

Téléchargements

Publié-e

2025-07-28

Comment citer

MacNevin, W., Dawe, N., Harkness, L., Salman, B., & Keefe, D. T. (2025). Evaluation of ChatGPT’s performance on answering pediatric urology questions based on association guidelines. Canadian Urological Association Journal, 19(11), E362–7. https://doi.org/10.5489/cuaj.9238

Télécharger la référence

Numéro

Vol. 19 No. 11 (2025): CUAJ November

Rubrique

Original Research

Licence

Les auteurs accordent les droits d’auteurs liés à l’article et son contenu à l’Association des urologues du Canada. Cette entente signifie que vous ne pouvez pas faire ce qui suit, sans d’abord obtenir l’autorisation écrite de l’AUC :

Afficher l’article sur tout site Web.
Traduire ou autoriser une tierce partie à traduire l’article.
Copier ou reproduire l’article par quelque moyen que ce soit et sous tout format que ce soit, ou autoriser d’autres à le faire, au-delà de ce qui est permis par la loi canadienne du droit d’auteur.
Copier ou reproduire des sections de l’article, y compris les tableaux et figures, par quelque moyen que ce soit, ou autoriser d’autres à le faire, au-delà de ce qui est permis par la loi canadienne du droit d’auteur.

L’AUC encourage l’usage des articles à des fins éducatives sans but commercial et ne refusera pas sans motif raisonnable toute demande d’autorisation à cet effet.

Vous conservez le droit moral lié à l’article et son contenu. Cela signifie que l’AUC ne peut utiliser ses droits d’auteurs d’une manière telle que cela pourrait avoir des répercussions négatives sur votre réputation ou sur votre droit à être associé à l’article.

L’AUC exige également que vous garantissiez ce qui suit :

Vous êtes l’auteur ou les auteurs et seul(s) propriétaire(s) du contenu, le contenu de l’article est original et n’a jamais été publié et vous n’en avez pas déjà cédé les droits d’auteurs ni accordé de licence concernant son contenu à toute autre tierce partie;
Toutes les personnes qui ont contribué de manière considérable à la rédaction de l’article sont mentionnées;
L’article ne viole aucun droit de propriété de toute tierce partie, et vous avez obtenu les autorisations requises pour inclure les travaux d’autres personnes dans cet article; et
L’article ne diffame aucune tierce partie ni ne viole les droits à la vie privée de toute tierce partie.

Evaluation of ChatGPT’s performance on answering pediatric urology questions based on association guidelines

Auteurs-es

DOI :

Mots-clés :

Résumé

Téléchargements

Téléchargements

Publié-e

Comment citer

Numéro

Rubrique

Licence

grouped_ads

Langue