GPT-4 pourrait répondre au défi de la surcharge de travail pour les radiologues
MERCREDI 24 AVRIL 2024
Le grand modèle de langage GPT-4 montre, dans une étude publiée dans la Revue Radiology, que ses performances égalent celles des radiologues dans la détection des erreurs dans les comptes rendus de radiologie. Cet outil plus rapide et plus économique que l’humain pourrait répondre au défi de la surcharge de travail pour les radiologues.

L’évaluation des grands modèles de langage tels GPT-4 d’OpenAI est un sujet souvent abordé par les chercheurs en imagerie médicale, du fait de l’assistance qu’il pourrait mettre à disposition des radiologues en routine.
Les différentes applications de GPT-4 en pratique radiologique
Car, de temps en temps, des erreurs peuvent survenir dans les comptes rendus de radiologie en raison notamment d'inexactitudes de la reconnaissance vocale ou d'une charge de travail élevée. Les grands modèles de langage, tels que GPT-4, ont le potentiel d'améliorer le processus de génération de ces comptes rendus. C’est ce que cherche à prouver une équipe allemande dans un article paru dans la Revue Radiology.
« Notre recherche propose un nouvel examen du potentiel du GPT-4 d'OpenAI, précise l'auteur principal de l'étude, ke Dr Roman J. Gertz, résident au service de radiologie de l'hôpital universitaire de Cologne (Allemagne). Des études antérieures ont démontré les applications potentielles du GPT-4 à différentes étapes du parcours du patient en radiologie : par exemple, sélectionner l'examen et le protocole d'imagerie corrects en fonction des antécédents médicaux d'un patient, transformer des comptes rendus de radiologie en texte libre en comptes rendus structurés ou générer automatiquement la section impression d’un rapport ».
Évaluation de la pertinence de GPT-4 pour la détection des erreurs dans les comptes rendus de radiologie
Cette étude est la première à comparer distinctement le GPT-4 et les performances humaines en matière de détection d'erreurs dans les comptes rendus de radiologie, évaluant ses capacités par rapport à des radiologues de niveaux d'expérience variés. Le Dr. Gertz et ses collègues ont entrepris d'évaluer l'efficacité de GPT-4 pour identifier les erreurs courantes dans les comptes rendus de radiologie, en se concentrant sur les performances, le temps et la rentabilité.
Pour cette étude, 200 comptes rendus de radiologie (radiographies et imagerie TDM/IRM) ont été rassemblés entre juin 2023 et décembre 2023 dans un seul établissement. Les chercheurs ont inséré 150 erreurs provenant de cinq catégories d’erreurs différentes (omission, insertion, orthographe, confusion secondaire et « autre ») dans 100 de ces comptes rendus. Six radiologues (deux radiologues seniors, deux médecins traitants et deux résidents) et GPT-4 ont été chargés de détecter ces erreurs.
Des scores identiques à ceux obtenus par les radiologues seniors
Les chercheurs ont découvert que GPT-4 avait un taux de détection d’erreur de 82,7% (124 sur 150), contre 89,3% pour les radiologues seniors (134 sur 150) et 80,0% pour les médecins traitants et les résidents en radiologie (120 sur 150), en moyenne.
Dans l'analyse globale, GPT-4 a détecté moins d'erreurs par rapport au radiologue senior le plus performant (82,7 % contre 94,7 %). Cependant, il n'y avait aucune preuve d'une différence dans le pourcentage de performance moyenne en matière de taux de détection d'erreurs entre GPT-4 et tous les autres praticiens.
Des performances plus rapides et plus économiques
GPT-4 nécessitait moins de temps de traitement par compte rendu que même le lecteur humain le plus rapide, et l'utilisation de GPT-4 entraînait un coût moyen de correction par rapport inférieur à celui du radiologue le plus rentable.
« Cette efficacité dans la détection des erreurs pourrait laisser présager un avenir où l'IA pourra aider à optimiser le flux de travail au sein des services de radiologie, en garantissant que les rapports sont à la fois précis et disponibles rapidement, renforçant ainsi la capacité du service de radiologie à fournir des diagnostics rapides et fiables », ajoute Dr. Gertz.
Un outil qui pourrait répondre efficacement au défi de la surcharge de travail pour les radiologues
Celui-ci note par ailleurs que les résultats de l'étude sont importants en raison de leur potentiel à améliorer les soins aux patients en augmentant l'exactitude des comptes rendus de radiologie grâce à la relecture assistée par GPT-4. Démontrant que GPT-4 peut égaler les performances de détection des erreurs des radiologues, tout en réduisant considérablement le temps et les coûts associés à la correction des comptes rendus, cette recherche montre les avantages potentiels de l'intégration de l'IA dans les services de radiologie.
« L'étude aborde des défis critiques en matière de soins de santé, tels que la demande croissante de services de radiologie et la pression visant à réduire les coûts opérationnels, conclut le Dr Gertz. Notre recherche fournit un exemple concret de la façon dont l’IA, notamment grâce à des applications comme GPT-4, peut révolutionner les soins de santé en améliorant l’efficacité, en minimisant les erreurs et en garantissant un accès plus large à des services de diagnostic fiables et abordables – des étapes fondamentales vers l’amélioration des résultats des soins aux patients. »
Bruno Benque avec RSNA