Vous êtes dans : Accueil > Actualités > Intelligence Artificielle, Machine Learning > La lecture des images radiologiques toujours pas au point pour Chat-GPT4 Vision

La lecture des images radiologiques toujours pas au point pour Chat-GPT4 Vision

LUNDI 09 SEPTEMBRE 2024 Soyez le premier à réagirSoyez le premier à réagir

Des chercheurs américains ont réalisé une étude, publiée dans la Revue Radiology, évaluant les performances de ChatGPT-4 Vision, capable d’interpréter du texte et de l’image. Ils ont constaté que le modèle fonctionnait bien sur les questions d'examen de radiologie textuelles, mais qu'il avait du mal à répondre avec précision aux questions liées aux images. Des réponses hallucinatoires suggèrent même des interprétations d’images incorrectes aux conséquences cliniques potentiellement graves.

RSNA

Chat GPT-4 Vision est connu pour être la première version du grand modèle de langage capable d'interpréter à la fois le texte et les images. Dans une étude publiée dans la Revue Radiology, des chercheurs américains ont éprouvé cet outil pour en évaluer l’efficacité.

Le grand modèle de langage ChatGPT-4 Vision éprouvé sur ses capacités à traiter les images radiologiques et les comptes rendus

« ChatGPT-4 s'est révélé prometteur pour aider les radiologues dans des tâches telles que la simplification des comptes rendus de radiologie destinés aux patients et l'identification du protocole approprié pour les examens d'imagerie, précise le Dr Chad Klochko, radiologue musculo-squelettique et chercheur en intelligence artificielle (IA) chez Henry Ford Health à Détroit (Michigan – USA). Grâce à ses capacités de traitement d'images, GPT-4 Vision permet de nouvelles applications potentielles en radiologie. »

Pour réaliser ce travail, l’équipe de recherche a utilisé des questions retirées des examens d’enseignement en radiologie diagnostique de l’American College of Radiology, une série de tests utilisés pour évaluer les capacités des internes en radiologie. Après avoir exclu les doublons, les chercheurs ont utilisé 377 questions dans 13 domaines, dont 195 questions contenant uniquement du texte et 182 contenant une image.

Un certain degré de compréhension textuelle en radiologie

GPT-4 Vision a répondu correctement à 246 des 377 questions, obtenant un score global de 65,3%. Le modèle a répondu correctement à 81,5% (159) des 195 requêtes contenant uniquement du texte et à 47,8% (87) des 182 questions contenant des images. « La précision de 81,5% pour les questions contenant uniquement du texte reflète les performances du modèle précédent, poursuit le Dr Klochko. Cette cohérence sur les questions textuelles peut suggérer que le modèle possède un certain degré de compréhension textuelle en radiologie. »

La radiologie génito-urinaire était la seule sous-spécialité pour laquelle GPT-4 Vision obtenait de meilleurs résultats sur les questions contenant des images (67%) que sur les questions contenant uniquement du texte (57%). Le modèle a obtenu de meilleurs résultats sur les questions contenant uniquement du texte dans toutes les autres sous-spécialités. Ses meilleurs résultats sur les questions basées sur des images apparaissent dans les sous-spécialités thoraciques et génito-urinaires, répondant correctement à 69% et 67% des questions, respectivement.

Des résultats variables selon le type de questions posées

Le modèle a obtenu les résultats les plus faibles sur les questions contenant des images dans le domaine de la médecine nucléaire, répondant correctement à seulement 2 questions sur 10. L'étude a également évalué l'impact de diverses invites sur les performances de GPT-4 Vision. Des questions estampillées « original », « de base », « chaîne de réflexion », « instruction courte » ou « instruction longue » ont éprouvé ses capacités.

Bien que le modèle ait répondu correctement à 183 des 265 questions avec une invite de base, il a refusé de répondre à 120 questions, dont la plupart contenaient une image. « Le phénomène de refus de répondre aux questions était quelque chose que nous n'avions pas observé lors de notre exploration initiale du modèle », ajoute le Dr Klochko. L'instruction courte a rapidement donné la précision la plus faible (62,6%).

Des réponses hallucinatoires qui suggèrent des interprétations d’images incorrectes aux conséquences cliniques potentiellement graves

Sur les questions textuelles, l'incitation par chaîne de réflexion a surpassé l'instruction longue de 6,1%, l'instruction de base de 6,8% et le style original de 8,9%. Il n'y avait aucune preuve suggérant des différences de performances entre deux invites sur des questions basées sur des images. « Notre étude a montré des signes de réponses hallucinatoires lors de l'interprétation des résultats des images, explique-t-il. Nous avons noté une tendance alarmante du modèle à fournir des diagnostics corrects basés sur des interprétations d'images incorrectes, ce qui pourrait avoir des implications cliniques significatives."

Les résultats de cette étude soulignent la nécessité de méthodes d’évaluation plus spécialisées et plus rigoureuses pour évaluer les performances des grands modèles de langage dans les tâches de radiologie. « Compte tenu des défis actuels liés à l'interprétation précise des images radiologiques clés et de la tendance aux réponses hallucinatoires, l'applicabilité de GPT-4 Vision dans des domaines critiques tels que la radiologie est limitée dans son état actuel », conclut le Dr Klochko.

Paco Carmine


Un logiciel d'IA taillé pour le dépistage du cancer du poumon par TDM low dose
03/04/2025 : Median Technologies a publié, le 31 Mars 2025, les résultats finaux de l’étude pivot RELIVE, qui confirment et complètent les premiers résultats annoncés le 3 Février 2025 à propos d’eyonis™, une suite de logiciels dispositifs médicaux basés sur l’IA pour le diagnostic précoce du cancer.

Un CADe français pour la radiographie thoracique obtient l'autorisation FDA
27/03/2025 : La firme française Gleamer a annoncé, le 25 Mars 2025, l’autorisation de mise sur le marché, par la Food and Drug Administration (FDA), de sa solution avancée d’interprétation des radiographies thoraciques, ChestView.

Recommandations européennes pour l'intégration de l'IA dans la radiologie
11/03/2025 : L’European Society of Radiology (ESR), sous la direction de son groupe de travail sur l'IA, vient de publier un document de recommandations pour une implémentation généralisée de l’European AI Act.

L'IA en imagerie thoracique nécessiterait une redéfinition du rôle des radiologues
07/03/2025 : L’imagerie thoracique à la pointe de l’intelligence artificielle. C’est le message que font passer des chercheurs coréens dans un article publié dans la Revue Radiology. Ils listent les applications de cette technologie, comme l’interprétation assistée par l’IA et dépistage opportuniste des maladies non ciblées, mais recommandent une redéfinition proactive du rôle des radiologues essentielle à l’intégration de l’IA en imagerie.

IABM 2025, le colloque pour maitriser l'IA en imagerie biomédicale
11/02/2025 : L’Institut National de Recherche en sciences et technologies du numérique (INRIA)organise, en coopération avec d’autres institutions scientifiques, le 3ème Colloque Français d’Intelligence Artificielle en Imagerie Biomédicale (IABM 2025), les 17 et 18 Mars 2025, au Palais de la Méditerranée à Nice.

Une startup européenne d'IA obtient une importante levée de fonds pour atteindre ses objectifs
27/11/2024 : La plateforme d’IA Raidium agit comme une fabrique de biomarqueurs d’imagerie au service de la pratique clinique et de la recherche. Elle annonce une levée de 13 M$ qui devrait lui permettre de progresser et d’obtenir les certifications FDA et CE.

La confiance des radiologues en l'IA : une arme à double tranchant
19/11/2024 : Lorsqu’ils prennent des décisions diagnostiques aidés par l’Intelligence Artificielle (IA), les radiologues lui font parfois trop confiance alors qu’elle signale une zone d'intérêt spécifique sur une radiographie. C’est en substance ce qui ressort d’une nouvelle étude publiée dans la Revue Radiology.

La lecture des images radiologiques toujours pas au point pour Chat-GPT4 Vision
09/09/2024 : Des chercheurs américains ont réalisé une étude, publiée dans la Revue Radiology, évaluant les performances de ChatGPT-4 Vision, capable d’interpréter du texte et de l’image. Ils ont constaté que le modèle fonctionnait bien sur les questions d'examen de radiologie textuelles, mais qu'il avait du mal à répondre avec précision aux questions liées aux images. Des réponses hallucinatoires suggèrent même des interprétations d’images incorrectes aux conséquences cliniques potentiellement graves.

L'IA vs le radiologue dans l'interprétation de la radiographie pulmonaire
03/09/2024 : Un outil d'intelligence artificielle (IA) utilisé dans une étude danoise publiée dans la Revue Radiology pour interpréter des radiographies pulmonaires s'est avéré efficace pour exclure une pathologie. Il a présenté des taux d'échec critiques sur les radiographies pulmonaires égaux ou inférieurs à ceux des radiologues, ses erreurs se révélant plus graves cliniquement.

Un grand modèle de langage open source pour concurrencer les modèles propriétaires
29/08/2024 : La Revue Radiology publie une étude allemande relative à la performance de Meta Llama 3, un grand modèle de langage open source qui concurrence les grands modèles propriétaires, tels que GPT-4 et Gemini. Les chercheurs ont soumis l’outil à un sous-ensemble de questions d'examen de type jury de radiologie et ont montré la pertinence de Meta Llama 3.


Les performances diagnostiques de l'IRM 3T accélérée six fois
29/04/2025 : L'IRM du genou 3-T accélérée six fois en moins de 5 minutes, utilisant l'imagerie parallèle et l'accélération multicoupes simultanée montre des performances diagnostiques améliorées pour l’exploration du genou. C’est ce que montre une étude publiée dans l’American Journal of Roentgenology (AJR) qui valide les apports de ce protocole en termes de visibilité structurale et d’identification des lésions cartilagineuses ou ligamentaires notamment.

La radiologie libérale en grève contre la proposition de Loi Garot
28/04/2025 : Un travail parlementaire transpartisan a été instauré depuis deux ans pour traiter en urgence le problème des déserts médicaux. Le secteur médical libéral se dresse contre la proposition de Loi Garot sur les autorisations d’installation qui en découle et la FNMR a débuté une grève, avant sa participation à la manifestation nationale du 29 Avril 2025.

LA SFRO organise bientôt l'élection de son nouveau bureau
24/04/2025 : La Société Française de Radiothérapie Oncologique (SFRO) organisera bientôt des élections pour renouveler son Bureau, qui doit comporter dix membres, élus pour 2 ans, ventilés selon trois représentants des CHU et CHG, trois représentants des ESPIC et CLCC, et quatre représentants du secteur libéral.

Thérapies valvulaires adaptées aux variantes anatomiques chez le sujet jeune
23/04/2025 : Dans notre série de procédures interventionnelles en vidéo, voici la session PCR Online diffusée le 16 Avril 2025 qui traitait de l’approche thérapeutique des valves cardiaque selon les différentiations anatomiques chez les jeunes patients.

L'IRM à bas champ étend son domaine clinique
23/04/2025 : Le Laboratoire de recherche en imagerie biomédicale multimodale Biomaps a fait récemment l’acquisition d’une modalité d’IRM bas champ très particulière. Elle pemettra de réaliser de la spirométrie 3D en IRM bas champ et des antennes supraconductrices ultrasensibles permettront d’obtenir des résolutions spatiales équivalentes aux IRM 7T ou 9T.

Évaluer la réponse complète à la chimiothérapie néoadjuvante à l'aide de l'IRM
22/04/2025 : La réponse complète à la chimiothérapie néoadjuvante est difficile à évaluer dans le cancer du sein. Un nouveau modèle utilisant l'IRM qui permettrait de prédire la survie sans récidive e été imaginé dans une étude publiée dans la Revue Radiology, qui combine le score d’hétérogénéité intratumorale et les données cliniques pour prédire la réponse complète eu traitement.

Le lexique radiologique standardisé RadLex fête ses vingt ans
22/04/2025 : RadLex, un lexique radiologique complet développé par la Radiological Society of North America (RSNA) destiné à proposer un langage commun pour communiquer les résultats diagnostiques par les radiologues, célèbre son 20e anniversaire en 2025.

JFR 2025 : les inscriptions sont d'ores et déjà ouvertes !
22/04/2025 : Les prochaines Journées Francophones de Radiologie (JFR) se tiendront du 3 au 6 octobre 2025 au Palais des Congrès de la Porte Maillot, Paris XVIIème. Le Président de l’événement cette année, le Pr Mathieu Lederlin, et son équipe ont choisi pour slogan principal : « La Radiologie, les images d’une vie ».

Quelle technique adopter pour quantifier la graisse dans la stéatose hépatique ?
18/04/2025 : Quelle serait la technique à adopter pour évaluer la quantification graisseuse dans la stétose hépatique à dysfonctionnement métabolique ? Une étude italienne publiée dans l’American Journal of Roentgenology (AJR) expérimente différents critères de ROI en échographie. La fraction de graisse en densité de protons y est utilisée comme référence pour évaluer les meilleurs accords inter opérateurs.

Détection du cancer post-mastectomie par l'IA : les chercheurs doivent persévérer
16/04/2025 : La surveillance des patientes présentant des antécédents de cancer du sein n’étant pas optimale, il est nécessaire d’évaluer les bénéfices de l’IA pour les patientes atteintes d’un cancer du sein post-mastectomie. Une étude coréenne publiée dans la Revue Radiology compare les performances de l’IA à celles des radiologues chez les patientes traitées par mastectomie unilatérale. Un taux de cancer non détectés significatif induit les chercheurs à continuer leurs travaux.


IRM DU SEIN: REHAUSSEMENT DU PARENCHYME COMME PREDICATEUR DE CANCER
13/05/2015 : Le rehaussement parenchymateux en IRM serait un signe favorable à la survenue probable d'un cancer du sein chez les patientes à haut risque. C'est ce qui ressort d'une étude, parue dans Radiology, qui a épluché cinq ans d'examens de dépistage au sein de plusieurs centres.

La radiologie libérale en grève contre la proposition de Loi Garot
28/04/2025 : Un travail parlementaire transpartisan a été instauré depuis deux ans pour traiter en urgence le problème des déserts médicaux. Le secteur médical libéral se dresse contre la proposition de Loi Garot sur les autorisations d’installation qui en découle et la FNMR a débuté une grève, avant sa participation à la manifestation nationale du 29 Avril 2025.

Les mises à jour des NRD sont inscrites dans la Loi
05/06/2019 : Les dispositions prises par l'ASN concernant la mise à jour des Niveau de Référence Diagnostique (NRD) viennent d'être validées par Arrêté publié au Journal Officiel. Les évaluations en scanner et en interventionnel comprendront 10 patients consécutifs.

Le CAD-RADS pour prédire les événements cardiovasculaires
22/07/2021 : CAD-RADS a récemment fait l’objet de modifications pour préciser les maladies coronariennes à partir du coroscanner. Une étude publiée dans la revue Radiology cherche à savoir si cette classification est pertinente pour prédire les événements cardiovasculaires.

Le lexique radiologique standardisé RadLex fête ses vingt ans
22/04/2025 : RadLex, un lexique radiologique complet développé par la Radiological Society of North America (RSNA) destiné à proposer un langage commun pour communiquer les résultats diagnostiques par les radiologues, célèbre son 20e anniversaire en 2025.

Les performances diagnostiques de l'IRM 3T accélérée six fois
29/04/2025 : L'IRM du genou 3-T accélérée six fois en moins de 5 minutes, utilisant l'imagerie parallèle et l'accélération multicoupes simultanée montre des performances diagnostiques améliorées pour l’exploration du genou. C’est ce que montre une étude publiée dans l’American Journal of Roentgenology (AJR) qui valide les apports de ce protocole en termes de visibilité structurale et d’identification des lésions cartilagineuses ou ligamentaires notamment.

La vague 2 du Ségur de la Radiologie est lancé
03/03/2025 : L’Agence du Numérique en Santé (ANS) vient de poser les bases d’un accès simplifié aux données de Santé pour les professionnels du secteur. En lançant la vague 2 du Ségur de la Radiologie, elle incite les éditeurs de logiciels d’imagerie à parfaire leur connexion à la DRIMBox et permettra aux acteurs du secteur d’améliorer l’intégration des documents dans le RIS notamment.

Un modèle d'IA peut prédire le cancer du sein à cinq ans
26/03/2024 : Des chercheurs américains ont développé un nouveau modèle d'intelligence artificielle (IA) interprétable pour prédire le risque de cancer du sein sur 5 ans à partir des mammographies, selon une nouvelle étude publiée aujourd'hui dans la Revue Radiology. Ils opensent que cet algorithme pourrait réduire la fréquence du dépistage du cancer du sein.

Les sociétés savantes se mobilisent pour une radiologie propre
04/03/2025 : L’European Society of Radiology (ESR), en collaboration avec dix sociétés savantes internationales de la discipline, a publié un document commun et un appel à l'action sur la durabilité en radiologie. L’article souligne le besoin urgent d’intégrer des pratiques respectueuses de l’environnement en radiologie tout en garantissant un accès mondial aux soins.

La TDM ultra haute résolution pour identifier les néoformations osseuses péri-implants cochléaires
13/12/2021 : La majorité des porteurs d'implants cochléaires développent une nouvelle formation osseuse qui affecte négativement la préservation de l'audition à long terme, selon une étude hollandaise publiée dans Radiologie. La tomodensitométrie à haute résolution spatiale pourrait permettre d’identifier et d’étudier les impacts de cette néoformation in-vivo en réduisant les artéfacts notamment.