Assessing the methodologic quality of systematic reviews using generative large language models
DOI :
https://doi.org/10.5489/cuaj.9243Mots-clés :
LLM, articial intelligence, ChatGPT, Methodology, Systematic review, AMSTAR 2Résumé
INTRODUCTION: We aimed to evaluate whether generative large language models (LLMs) can accurately assess the methodologic quality of systematic reviews (SRs).
METHODS: A total of 114 SRs from five leading urology journals were included in the study. Human reviewers graded each of the SRs in duplicate, with differences adjudicated by a third expert. We created a customized generative artificial intelligence (generative pretrained transformer [GPT]), “Urology AMSTAR 2 Quality Assessor,” and graded the 114 SRs in three iterations using a zero-shot method. We performed an enhanced trial focusing on critical criteria by giving GPT detailed, step-by-step instructions for each of the SRs using chain-of-thought method. Accuracy, sensitivity, specificity, and F1 score for each GPT trial were calculated against human results. Internal validity among three trials were computed.
RESULTS: GPT had an overall congruence of 75%, with 77% in critical criteria and 73% in non-critical criteria when compared to human results. The average F1 score was 0.66. There was a high internal validity at 85% among three iterations. GPT accurately assigned 89% of studies into the correct overall category. When given specific, step-by-step instructions, congruence of critical criteria improved to 91%, and overall quality assessment accuracy to 93%.
CONCLUSIONS: GPT showed promising ability to efficiently and accurately assess the quality of SRs in urology.
Téléchargements
Téléchargements
Publié-e
Comment citer
Numéro
Rubrique
Licence
Les auteurs accordent les droits d’auteurs liés à l’article et son contenu à l’Association des urologues du Canada. Cette entente signifie que vous ne pouvez pas faire ce qui suit, sans d’abord obtenir l’autorisation écrite de l’AUC :
- Afficher l’article sur tout site Web.
- Traduire ou autoriser une tierce partie à traduire l’article.
- Copier ou reproduire l’article par quelque moyen que ce soit et sous tout format que ce soit, ou autoriser d’autres à le faire, au-delà de ce qui est permis par la loi canadienne du droit d’auteur.
- Copier ou reproduire des sections de l’article, y compris les tableaux et figures, par quelque moyen que ce soit, ou autoriser d’autres à le faire, au-delà de ce qui est permis par la loi canadienne du droit d’auteur.
L’AUC encourage l’usage des articles à des fins éducatives sans but commercial et ne refusera pas sans motif raisonnable toute demande d’autorisation à cet effet.
Vous conservez le droit moral lié à l’article et son contenu. Cela signifie que l’AUC ne peut utiliser ses droits d’auteurs d’une manière telle que cela pourrait avoir des répercussions négatives sur votre réputation ou sur votre droit à être associé à l’article.
L’AUC exige également que vous garantissiez ce qui suit :
- Vous êtes l’auteur ou les auteurs et seul(s) propriétaire(s) du contenu, le contenu de l’article est original et n’a jamais été publié et vous n’en avez pas déjà cédé les droits d’auteurs ni accordé de licence concernant son contenu à toute autre tierce partie;
- Toutes les personnes qui ont contribué de manière considérable à la rédaction de l’article sont mentionnées;
- L’article ne viole aucun droit de propriété de toute tierce partie, et vous avez obtenu les autorisations requises pour inclure les travaux d’autres personnes dans cet article; et
- L’article ne diffame aucune tierce partie ni ne viole les droits à la vie privée de toute tierce partie.
