Vous êtes dans : Accueil > Actualités > Intelligence Artificielle, Machine Learning > Des chatbot radiologiques pas encore totalement cohérents... mais des progrès certains

Des chatbot radiologiques pas encore totalement cohérents... mais des progrès certains

LUNDI 26 JUIN 2023 Soyez le premier à réagirSoyez le premier à réagir

Les modèles linguistiques générés par l’IA ne sont pas encore assez évolués aujourd’hui pour donner des réponses toujours cohérentes à des questions radiologiques posées. C’est ce que rapportent des chercheurs dans un une étude publiée dans la Revue Radiology, dans laquelle ils prévoient des améliorations rapides sur ce champ.

RSNA

Les modèles de chatbot à grande étendue de langage comme ChatGPT et Google Bard sont de plus en plus introduits dans la sphère publique. Les patients recherchent sur Internet des réponses sur des situations médicales et des comptes rendus et les systèmes de soins de santé se tournent vers ces outils pour répondre aux questions des patients en ligne. Mais quelle est leur précision ? Peut-on compter sur eux pour traiter des questions importantes sur des conditions médicales complexes ?

Une étude compare les informations issues des modèles linguistiques générés par l’IA

Dans une nouvelle étude publiée dans la Revue Radiology, des chercheurs ont évalué et comparé l'exactitude et la cohérence des réponses générées par ChatGPT, Google Bard et des moteurs de recherche bien connus. Quarante questions non expertes sur la prévention, le dépistage et la terminologie du cancer du poumon couramment utilisées dans les comptes rendus de radiologie ont été créées et présentées à ChatGPT et Google Bard, ainsi qu'aux moteurs de recherche Bing et Google. Les réponses ont été notées comme correctes, partiellement correctes, incorrectes ou sans réponse.

ChatGPT a répondu à 120 questions avec 85 (70,8%) correctes, 14 (11,7%) partiellement correctes et 21 (17,5%) incorrectes. Google Bard n'a pas répondu à 23 (19,1 %) questions. Parmi les 97 questions auxquelles Google Bard a répondu, 62 (51,7%) étaient correctes, 11 (9,2%) étaient partiellement correctes et 24 (20%) étaient incorrectes. Ni ChatGPT ni Google Bard n'ont répondu avec une cohérence à 100 % des questions.

Des résultats disparates et beaucoup de réponses incohérentes

Bing a répondu à 120 questions dont 74 (61,7%) correctes, 13 (10,8%) partiellement correctes et 33 (27,5%) incorrectes. Le moteur de recherche Google a répondu à 120 questions dont 66 (55%) correctes, 27 (22,5%) partiellement correctes et 27 (22,5%) incorrectes. Les chercheurs ont observé que ces grands modèles linguistiques ont du mal à fournir des réponses précises face à une terminologie médicale complexe ou technique. Les réponses incorrectes fournies par les chatbots peuvent être liées au fait que ces langages sont formés principalement sur des contenus Internet tels que des articles, des livres, Wikipédia, des actualités et des sites Web, plutôt que sur des informations provenant de sociétés savantes.

Une technologie qui progresse vite pour des outils qui pourraient être utilisables dans un avenir proche

« Pour résoudre ces problèmes, il est nécessaire de les affiner et de les recycler pour éviter de générer des informations inexactes, précisent les auteurs. Bien que cela puisse sembler être une tâche difficile, en fin de compte, les générations futures de ces langages devraient être capables de dialoguer avec les utilisateurs avec l’assurance que leurs réponses correspondent aux questions précises posées. »

Parmi les limites de leur étude, les chercheurs admettent avoir utilisé la version de ChatGPT et Google Bard qui était disponible en avril 2023, alors que des langages comme Med-PaLM et Med-PaLM 2 semblent plus évolués. Ces agents intelligents génératifs progressent rapidement et les futures versions pourraient donner des résultats différents. Ils reconnaissent enfin que les 40 questions sur le cancer du poumon utilisées dans ce travail ne représentent peut-être pas entièrement l'éventail complet des questions à caractère médical.

Bruno Benque avec RSNA


Un modèle de segmentation automatique en TDM abdominale pédiatrique
10/05/2024 : Les modèles d'apprentissage par transfert formés sur des ensembles de données publiques hétérogènes et affinés à l'aide de données pédiatriques institutionnelles ont fait l’objet d’une étude publiée dans l’American Journal of Roentgenology (AJR). Ces modèles ont surpassé les modèles de formation native interne et TotalSegmentator dans les données d’examens TDM pédiatriques citées en référence.

GPT-4 pourrait répondre au défi de la surcharge de travail pour les radiologues
24/04/2024 : Le grand modèle de langage GPT-4 montre, dans une étude publiée dans la Revue Radiology, que ses performances égalent celles des radiologues dans la détection des erreurs dans les comptes rendus de radiologie. Cet outil plus rapide et plus économique que l’humain pourrait répondre au défi de la surcharge de travail pour les radiologues.

Un modèle d'IA plus performant pour identifier les patientes éligibles à une mammographie supplémentaire
09/04/2024 : Une étude suédoise publiée dans la Revue Radiology teste AISmartDensity pour l’identification des patientes éligibles à une imagerie supplémentaire après une mammographie de dépistage négative. Ce travail montre une plus grande eficacité de ce modèle par rapport aux outils classiques de mesure de densité des seins.

Deux outils d'IA pour la TDM d'une société française validés par la FDA
27/03/2024 : La FDA vient de valider la distribution aux USA de deux algorithmes d’assistance à l’interprétation développés par Avicienna.AI. Il s’agit de CINA-iPE et CINA-ASPECTS, deux outils pour la tomodensitométrie.

Partenariat stratégique pour améliorer le diagnostic d'EP à la TDM
16/02/2024 : Avicenna.AI a annoncé, le 14 février 2024, un partenariat stratégique pour intégrer CINA-iPE dans la Blackford AI Platform. La collaboration offre aux professionnels de la santé des capacités améliorées pour détecter les embolies pulmonaires accidentelles dans les TDM de routine.

Des leaders d'opinion promeuvent l'IA pour la radiographie thoracique
29/01/2024 : La radiographie thoracique est l’un des examens qui bénéficient le plus de l’apport de l’IA. Dans éditorial publié dans la Revue Radiology, des leaders d’opinion font la promotion de cette évolution et y voient une opportunité pour que les radiologues reviennent au plus près de leurs patients.

Plaidoyer international pour des usages de l'IA éthiques et responsables en radiologie
25/01/2024 : En publiant la déclaration « Developing, Purchasing, Implementing and Monitoring AI Tools in Radiology: Practical Considerations », cinq sociétés savantes de radiologie s’unissent pour un usage de l’IA éthique et sécuritaire. Ce document plaide pour une collaboration internationale entre les développeurs, les cliniciens et les institutions.

TwinOnco, le projet innovant de suivi des patients porté par l'AP-HP et Dassault Systèmes
23/01/2024 : L’AP-HP et Dassault Systèmes ont élaboré le projet TwinOnco qui vise à créer des jumeaux virtuels aux patients en oncologie. Cette initiative permettra de passer une étape dans la personnalisation des traitements et génèrera de nouvelles cohortes de patients en onciologie.

Une nouvelle formation certifiante RSNA sur l'IA en imagerie d'urgence
22/01/2024 : Dans le panel de formations qu’elle propose aux radiologues sur le champ des applications de l’IA pour l’imagerie médicale, la RSNA lance un cours validant sur la radiologie d’urgence intitulé RSNA Emergency Imaging AI Certificate. D’autres cours relatifs à l’IA en imagerie, de base ou avancés, sont aussi accessibles.

Le RSNA Cervical Spine Fracture AI Challenge a rendu son verdict
10/01/2024 : Le RSNA Cervical Spine Fracture AI Challenge 2022 a rendu son verdict en sélectionnant les 8 projets les plus performants parmi plus de 20 000 candidatures soumises. Ces algorithmes de haute qualité font avancer de manière significative la recherche sur l’IA en radiologie


Vers un encadrement des nouvelles méthodologies de la recherche médicale
17/05/2024 : La recherche clinique faisant l’objet de méthodologies alternatives utilisant les technologies modernes, un groupe de travail international publie les résultats de son analyse et émet ses premières recommandations. Un colloque international présentera bientôt ces travaux à Lille.

Corrélation entre infiltration graisseuse du teres minor et prévalence du muscle sous glénoïde accessoire
17/05/2024 : Lors du 124e congrès annuel de l'American Roentgen Ray Society (ARRS), un poster relatif à l’IRM de l’épaule a été primé. Ce travail a mis en lumière la prévalence du muscle sous-glénoïde accessoire chez les patients présentant une infiltration graisseuse du teres minor, avec, souvent, une neuropathie associée.

Une majorité de cardiologues interventionnels plébiscite la robotique
15/05/2024 : Un sondage international effectué auprès de cardiologues interventionnels sonne comme un plébiscite pour l’intégration de la robotique dans leur activité. Ils évoquent la qualité et l’homogénéité des interventions, la radioprotection et l’évolution digitale de la discipline.

Compilation scientifique sur la radiothérapie Ultra Haut Débit de Dose
15/05/2024 : L’Institut de Radioprotection et de Sureté Nucléaire (IRSN) vient de publier un Rapport sur la radiothérapie à ultra haut débit de dose. Il s’agit d’une revue de la littérature scientifique dédiée à cette technique de radiothérapie FLASH qui n’a généré encore que peu de recommandations de bonnes pratiques.

Traitement d'une réocclusion de l'artère fémorale en vidéo
15/05/2024 : Dans notre série de procédures interventionnelles en vidéo, voici un live case réalisé lors du dernier ML-CTO Course Endovascular. Il s’agit du traitement par Rotarex d’une réocclusion intrastent au niveau d’une artère fémorale superficielle.

IRM pédiatrique : le feed & wrap comme alternative à la sédation profonde
14/05/2024 : La sédation profonde peut provoquer des effets secondaires pour les nouveau-nés qui doivent faire l'objet d'une IRM. Une étude publiée dans la Revue European Radiology évalue la qualité d’image obtenue en utilisant la technique d’immobilisation Feed and Wrap. Les chercheurs y voient une méthode efficace avec une qualité d’image significative et annoncent la fin de la sédation profonde pour les nouveau-nés candidats à l’IRM.

Le ganglion axillaire prédicteur de maladie cardiovasculaire ?
13/05/2024 : L'American Roentgen Ray Society (ARRS) publie les résultats d’un travail de recherche sur les ganglions axillaires identifiés en mammographie de dépistage. Un poster présenté lors du 124ème congrès de cette société avance notamment que les galglions graisseux seraient prédicteurs de maladies cardiovasculaires à 10 ans.

Un modèle de segmentation automatique en TDM abdominale pédiatrique
10/05/2024 : Les modèles d'apprentissage par transfert formés sur des ensembles de données publiques hétérogènes et affinés à l'aide de données pédiatriques institutionnelles ont fait l’objet d’une étude publiée dans l’American Journal of Roentgenology (AJR). Ces modèles ont surpassé les modèles de formation native interne et TotalSegmentator dans les données d’examens TDM pédiatriques citées en référence.

Des GML non pertinents pour les tâches cliniques complexes
07/05/2024 : L'utilisation de grands modèles de langage (GML) accessibles au public pour des tâches cliniques complexes peut engendrer un effet négatif sur la prise en charge des patients, selon une nouvelle étude internationale publiée dans la Revue Radiology. Les résultats de l’étude soulignent la nécessité de réglementer ces GML dans des scénarios qui nécessitent un raisonnement médical de haut niveau.

Revascularisation d'IVA occluse en vidéo
02/05/2024 : Dans notre série de procédures interventionnelles en vidéo, nous vous présentons aujourd’hui la revascularisation d’une IVA occluse à l’aie d’un guide nouvelle génération.


Installer une salle interventionnelle ou une hybride ? L'ANAP a étudié la question
06/12/2019 : L’ANAP vient de publier un guide d’aide à la décision pour les promoteurs de salle hybride interventionnelle en établissement de Santé. Ce document montre comment le projet médico-soignant du secteur impacte le choix du matériel et la réussite du processus d’installation.

Save the date : le congrès de la SFRO 2024 au CNIT Forest
01/12/2023 : Le 35ème congrès de la SFRO est annoncé pour novembre 2024 au CNIT Forest de Paris La Défense. D’ici-là, le replay de la session 2023 est toujours disponible.

Vers un encadrement des nouvelles méthodologies de la recherche médicale
17/05/2024 : La recherche clinique faisant l’objet de méthodologies alternatives utilisant les technologies modernes, un groupe de travail international publie les résultats de son analyse et émet ses premières recommandations. Un colloque international présentera bientôt ces travaux à Lille.

Une majorité de cardiologues interventionnels plébiscite la robotique
15/05/2024 : Un sondage international effectué auprès de cardiologues interventionnels sonne comme un plébiscite pour l’intégration de la robotique dans leur activité. Ils évoquent la qualité et l’homogénéité des interventions, la radioprotection et l’évolution digitale de la discipline.

Bientôt des équipes développement durable dans les centres de radiologie ?
25/04/2024 : Un groupe de radiologues international, dirigé par des auteurs de l'Université de Toronto, a développé une approche permettant aux unités et cabinets de radiologie de réduire leurs émissions de gaz à effet de serre et de devenir plus résilients aux effets du changement climatique. Ils ont présenté leur plan d'action dans la Revue Radiology.

Traitement d'une réocclusion de l'artère fémorale en vidéo
15/05/2024 : Dans notre série de procédures interventionnelles en vidéo, voici un live case réalisé lors du dernier ML-CTO Course Endovascular. Il s’agit du traitement par Rotarex d’une réocclusion intrastent au niveau d’une artère fémorale superficielle.

Save the date : séminaire qualité en médecine nucléaire
29/04/2024 : La mise en place d’un système qualité en médecine nucléaire robuste et pragmatique fera l’objet d’un séminaire organisé à La Baule en mai prochain. Les participants découvriront un système qualité facile et pragmatique.

Compilation scientifique sur la radiothérapie Ultra Haut Débit de Dose
15/05/2024 : L’Institut de Radioprotection et de Sureté Nucléaire (IRSN) vient de publier un Rapport sur la radiothérapie à ultra haut débit de dose. Il s’agit d’une revue de la littérature scientifique dédiée à cette technique de radiothérapie FLASH qui n’a généré encore que peu de recommandations de bonnes pratiques.

Nouvel essai pour le traitement du glioblastome à l'aide de Sonocloud
26/04/2024 : Un essai clinique de phase 2a va être mis en œuvre à la Northwestern University de Chicago pour évaluer l’efficacité et la sécurité d’un traitement du glioblastome favorisé par modulation des checkpoints immunitaires. Cet essai utilisera les propriétés du dispositif Sonocloud-9.

Corrélation entre infiltration graisseuse du teres minor et prévalence du muscle sous glénoïde accessoire
17/05/2024 : Lors du 124e congrès annuel de l'American Roentgen Ray Society (ARRS), un poster relatif à l’IRM de l’épaule a été primé. Ce travail a mis en lumière la prévalence du muscle sous-glénoïde accessoire chez les patients présentant une infiltration graisseuse du teres minor, avec, souvent, une neuropathie associée.