Vous êtes dans : Accueil > Actualités > Intelligence Artificielle, Machine Learning > Les chercheurs n'ont pas confiance aux chatbots scientifiques

Les chercheurs n'ont pas confiance aux chatbots scientifiques

VENDREDI 03 FéVRIER 2023 Soyez le premier à réagirSoyez le premier à réagir

Un nouvel article publié dans la Revue Radiology met en garde contre « l'épée à double tranchant » que constituent les programmes nationaux de traitement du langage basés sur l'intelligence artificielle (IA) comme ChatGPT. Les auteurs donnent quelques conseils pour utiliser ces systèmes avec parcimonie et précision.

RSNA

ChatGPT, un chatbot avancé, a été lancé par OpenAI à la fin de l'année 2022 et est rapidement devenu populaire, car il répond à des questions complexes avec des réponses de qualité humaine.

Des modèles d’IA de langage virtuel frappés souvent d’effet d’hallucination

ChatGPT est un système d'IA conversationnel lancé par OpenAI, une société de recherche et de déploiement d'IA. Il est basé sur le GPT-3.5, l'un des plus grands modèles de langage virtuel (MLV) (> 175 milliards de paramètres) à ce jour, et a été formé sur un ensemble diversifié de textes Internet (environ 570 Go), parmi lesquels des livres, des articles et des sites Web, et couvrant un large éventail de sujets tels que les actualités, Wikipédia et la fiction. De plus, ChatGPT est spécialement conçu pour les tâches conversationnelles, une fonctionnalité acquise par renforcement à partir du feed-back humain.

Cette technique permet à ChatGPT d'ajuster son comportement en fonction des commentaires des évaluateurs humains. Il est donc bien meilleur pour comprendre les intentions des utilisateurs, générer un texte de type humain et maintenir la cohérence dans une conversation. Mais malgré ces qualités, ChatGPT a plusieurs limites, notamment la production de réponses apparemment crédibles mais incorrectes, telles que l'invention de termes avec lesquels il doit se familiariser. Ce phénomène, connu sous le nom « d'effet d'hallucination », est un problème commun à de nombreux modèles de traitement du langage naturel. De plus, ChatGPT a tendance à suivre les instructions plutôt qu'à s'engager dans une véritable interaction.

Des chatbots pour donner des conseils sur la pertinence des actes ?

Par conséquent, ChatGPT et autres MLV peuvent avoir des répercussions imprévues et devenir une épée à double tranchant. Dans un article publié dans la Revue Radiology, des chercheurs américains discutent des bonnes pratiques d’utilisation de ChatGPT dans le cadre clinique pour augmenter l'efficacité et potentiellement améliorer les soins aux patients, mais donnent également la parole aux chercheurs qui craignent que ChatGPT puisse rédiger de faux articles de recherche susceptibles de tromper les scientifiques et les examinateurs, jusqu’à réduire l'intégrité scientifique des publications.

Au cours des dernières années, l'accent a été mis sur l'amélioration de la précision des prescriptions d'examens d'imagerie médicale par les correspondants, via des logiciels d’aide à la décision ou, sur la base du Dossier patient informatisé (DPI), afin d’obtenir une meilleure justification des actes. Alors que la technologie de l'IA montait en puissance, une nouvelle question est apparue : une technologie basée sur l'IA peut-elle fournir des conseils sur la pertinence des actes ?

Des questions imprécises entraînent quelquefois des réponses incohérentes

Les auteurs de l’article suggèrent que les chatbots basés sur l'IA comme ChatGPT peuvent tirer parti de vastes bases de connaissances pour répondre rapidement aux questions concernant la meilleure exploration radiologique dans des scénarios cliniques spécifiques. Cependant, bien qu’il puisse fournir des conseils, il a été conçu pour ne pas offrir de conseils directs aux praticiens. Elle confie souvent la prise de décision médicale aux professionnels de santé dans le respect des règles de sécurité dédiées à sa technologie. De plus, les utilisateurs doivent soigneusement rédiger des questions ou des invites, en fournissant des informations spécifiques sur un scénario clinique et les contre-indications potentielles. Sans invites détaillées ni possibilités de réponse limitées, ChatGPT peut souvent donner des résultats inexacts ou incomplets.

D’autre part, la précision des réponses fournies par une technologie basée sur l'IA dépend de la qualité et du type de données utilisées pour la former. Les prestataires doivent être conscients des biais, des inexactitudes ou de potentielles idées fausses dans ces données. Enfin, l'utilisation d'une technologie basée sur l'IA en dehors d'un DPI peut ne pas cibler les bonnes informations du patient ainsi que les préférences, les capacités et les restrictions relatives à la prescription du correspondant pour faciliter la prise de décision.

« Alors que nous naviguons dans les décisions concernant l'utilisation de technologies basées sur l'IA comme ChatGPT, il est important de procéder avec prudence », écrivent les auteurs. Ils donnent quelques conseils pour les utiliser avec parcimonie et précision.

Bruno Benque avec RSNA


Un modèle de segmentation automatique en TDM abdominale pédiatrique
10/05/2024 : Les modèles d'apprentissage par transfert formés sur des ensembles de données publiques hétérogènes et affinés à l'aide de données pédiatriques institutionnelles ont fait l’objet d’une étude publiée dans l’American Journal of Roentgenology (AJR). Ces modèles ont surpassé les modèles de formation native interne et TotalSegmentator dans les données d’examens TDM pédiatriques citées en référence.

GPT-4 pourrait répondre au défi de la surcharge de travail pour les radiologues
24/04/2024 : Le grand modèle de langage GPT-4 montre, dans une étude publiée dans la Revue Radiology, que ses performances égalent celles des radiologues dans la détection des erreurs dans les comptes rendus de radiologie. Cet outil plus rapide et plus économique que l’humain pourrait répondre au défi de la surcharge de travail pour les radiologues.

Un modèle d'IA plus performant pour identifier les patientes éligibles à une mammographie supplémentaire
09/04/2024 : Une étude suédoise publiée dans la Revue Radiology teste AISmartDensity pour l’identification des patientes éligibles à une imagerie supplémentaire après une mammographie de dépistage négative. Ce travail montre une plus grande eficacité de ce modèle par rapport aux outils classiques de mesure de densité des seins.

Deux outils d'IA pour la TDM d'une société française validés par la FDA
27/03/2024 : La FDA vient de valider la distribution aux USA de deux algorithmes d’assistance à l’interprétation développés par Avicienna.AI. Il s’agit de CINA-iPE et CINA-ASPECTS, deux outils pour la tomodensitométrie.

Partenariat stratégique pour améliorer le diagnostic d'EP à la TDM
16/02/2024 : Avicenna.AI a annoncé, le 14 février 2024, un partenariat stratégique pour intégrer CINA-iPE dans la Blackford AI Platform. La collaboration offre aux professionnels de la santé des capacités améliorées pour détecter les embolies pulmonaires accidentelles dans les TDM de routine.

Des leaders d'opinion promeuvent l'IA pour la radiographie thoracique
29/01/2024 : La radiographie thoracique est l’un des examens qui bénéficient le plus de l’apport de l’IA. Dans éditorial publié dans la Revue Radiology, des leaders d’opinion font la promotion de cette évolution et y voient une opportunité pour que les radiologues reviennent au plus près de leurs patients.

Plaidoyer international pour des usages de l'IA éthiques et responsables en radiologie
25/01/2024 : En publiant la déclaration « Developing, Purchasing, Implementing and Monitoring AI Tools in Radiology: Practical Considerations », cinq sociétés savantes de radiologie s’unissent pour un usage de l’IA éthique et sécuritaire. Ce document plaide pour une collaboration internationale entre les développeurs, les cliniciens et les institutions.

TwinOnco, le projet innovant de suivi des patients porté par l'AP-HP et Dassault Systèmes
23/01/2024 : L’AP-HP et Dassault Systèmes ont élaboré le projet TwinOnco qui vise à créer des jumeaux virtuels aux patients en oncologie. Cette initiative permettra de passer une étape dans la personnalisation des traitements et génèrera de nouvelles cohortes de patients en onciologie.

Une nouvelle formation certifiante RSNA sur l'IA en imagerie d'urgence
22/01/2024 : Dans le panel de formations qu’elle propose aux radiologues sur le champ des applications de l’IA pour l’imagerie médicale, la RSNA lance un cours validant sur la radiologie d’urgence intitulé RSNA Emergency Imaging AI Certificate. D’autres cours relatifs à l’IA en imagerie, de base ou avancés, sont aussi accessibles.

Le RSNA Cervical Spine Fracture AI Challenge a rendu son verdict
10/01/2024 : Le RSNA Cervical Spine Fracture AI Challenge 2022 a rendu son verdict en sélectionnant les 8 projets les plus performants parmi plus de 20 000 candidatures soumises. Ces algorithmes de haute qualité font avancer de manière significative la recherche sur l’IA en radiologie


Vers un encadrement des nouvelles méthodologies de la recherche médicale
17/05/2024 : La recherche clinique faisant l’objet de méthodologies alternatives utilisant les technologies modernes, un groupe de travail international publie les résultats de son analyse et émet ses premières recommandations. Un colloque international présentera bientôt ces travaux à Lille.

Corrélation entre infiltration graisseuse du teres minor et prévalence du muscle sous glénoïde accessoire
17/05/2024 : Lors du 124e congrès annuel de l'American Roentgen Ray Society (ARRS), un poster relatif à l’IRM de l’épaule a été primé. Ce travail a mis en lumière la prévalence du muscle sous-glénoïde accessoire chez les patients présentant une infiltration graisseuse du teres minor, avec, souvent, une neuropathie associée.

Une majorité de cardiologues interventionnels plébiscite la robotique
15/05/2024 : Un sondage international effectué auprès de cardiologues interventionnels sonne comme un plébiscite pour l’intégration de la robotique dans leur activité. Ils évoquent la qualité et l’homogénéité des interventions, la radioprotection et l’évolution digitale de la discipline.

Compilation scientifique sur la radiothérapie Ultra Haut Débit de Dose
15/05/2024 : L’Institut de Radioprotection et de Sureté Nucléaire (IRSN) vient de publier un Rapport sur la radiothérapie à ultra haut débit de dose. Il s’agit d’une revue de la littérature scientifique dédiée à cette technique de radiothérapie FLASH qui n’a généré encore que peu de recommandations de bonnes pratiques.

Traitement d'une réocclusion de l'artère fémorale en vidéo
15/05/2024 : Dans notre série de procédures interventionnelles en vidéo, voici un live case réalisé lors du dernier ML-CTO Course Endovascular. Il s’agit du traitement par Rotarex d’une réocclusion intrastent au niveau d’une artère fémorale superficielle.

IRM pédiatrique : le feed & wrap comme alternative à la sédation profonde
14/05/2024 : La sédation profonde peut provoquer des effets secondaires pour les nouveau-nés qui doivent faire l'objet d'une IRM. Une étude publiée dans la Revue European Radiology évalue la qualité d’image obtenue en utilisant la technique d’immobilisation Feed and Wrap. Les chercheurs y voient une méthode efficace avec une qualité d’image significative et annoncent la fin de la sédation profonde pour les nouveau-nés candidats à l’IRM.

Le ganglion axillaire prédicteur de maladie cardiovasculaire ?
13/05/2024 : L'American Roentgen Ray Society (ARRS) publie les résultats d’un travail de recherche sur les ganglions axillaires identifiés en mammographie de dépistage. Un poster présenté lors du 124ème congrès de cette société avance notamment que les galglions graisseux seraient prédicteurs de maladies cardiovasculaires à 10 ans.

Un modèle de segmentation automatique en TDM abdominale pédiatrique
10/05/2024 : Les modèles d'apprentissage par transfert formés sur des ensembles de données publiques hétérogènes et affinés à l'aide de données pédiatriques institutionnelles ont fait l’objet d’une étude publiée dans l’American Journal of Roentgenology (AJR). Ces modèles ont surpassé les modèles de formation native interne et TotalSegmentator dans les données d’examens TDM pédiatriques citées en référence.

Des GML non pertinents pour les tâches cliniques complexes
07/05/2024 : L'utilisation de grands modèles de langage (GML) accessibles au public pour des tâches cliniques complexes peut engendrer un effet négatif sur la prise en charge des patients, selon une nouvelle étude internationale publiée dans la Revue Radiology. Les résultats de l’étude soulignent la nécessité de réglementer ces GML dans des scénarios qui nécessitent un raisonnement médical de haut niveau.

Revascularisation d'IVA occluse en vidéo
02/05/2024 : Dans notre série de procédures interventionnelles en vidéo, nous vous présentons aujourd’hui la revascularisation d’une IVA occluse à l’aie d’un guide nouvelle génération.


Installer une salle interventionnelle ou une hybride ? L'ANAP a étudié la question
06/12/2019 : L’ANAP vient de publier un guide d’aide à la décision pour les promoteurs de salle hybride interventionnelle en établissement de Santé. Ce document montre comment le projet médico-soignant du secteur impacte le choix du matériel et la réussite du processus d’installation.

Traitement d'une réocclusion de l'artère fémorale en vidéo
15/05/2024 : Dans notre série de procédures interventionnelles en vidéo, voici un live case réalisé lors du dernier ML-CTO Course Endovascular. Il s’agit du traitement par Rotarex d’une réocclusion intrastent au niveau d’une artère fémorale superficielle.

Vers un encadrement des nouvelles méthodologies de la recherche médicale
17/05/2024 : La recherche clinique faisant l’objet de méthodologies alternatives utilisant les technologies modernes, un groupe de travail international publie les résultats de son analyse et émet ses premières recommandations. Un colloque international présentera bientôt ces travaux à Lille.

Bientôt des équipes développement durable dans les centres de radiologie ?
25/04/2024 : Un groupe de radiologues international, dirigé par des auteurs de l'Université de Toronto, a développé une approche permettant aux unités et cabinets de radiologie de réduire leurs émissions de gaz à effet de serre et de devenir plus résilients aux effets du changement climatique. Ils ont présenté leur plan d'action dans la Revue Radiology.

Nouvel essai pour le traitement du glioblastome à l'aide de Sonocloud
26/04/2024 : Un essai clinique de phase 2a va être mis en œuvre à la Northwestern University de Chicago pour évaluer l’efficacité et la sécurité d’un traitement du glioblastome favorisé par modulation des checkpoints immunitaires. Cet essai utilisera les propriétés du dispositif Sonocloud-9.

Compilation scientifique sur la radiothérapie Ultra Haut Débit de Dose
15/05/2024 : L’Institut de Radioprotection et de Sureté Nucléaire (IRSN) vient de publier un Rapport sur la radiothérapie à ultra haut débit de dose. Il s’agit d’une revue de la littérature scientifique dédiée à cette technique de radiothérapie FLASH qui n’a généré encore que peu de recommandations de bonnes pratiques.

Une majorité de cardiologues interventionnels plébiscite la robotique
15/05/2024 : Un sondage international effectué auprès de cardiologues interventionnels sonne comme un plébiscite pour l’intégration de la robotique dans leur activité. Ils évoquent la qualité et l’homogénéité des interventions, la radioprotection et l’évolution digitale de la discipline.

Save the date : séminaire qualité en médecine nucléaire
29/04/2024 : La mise en place d’un système qualité en médecine nucléaire robuste et pragmatique fera l’objet d’un séminaire organisé à La Baule en mai prochain. Les participants découvriront un système qualité facile et pragmatique.

Save the date : le congrès de la SFRO 2024 au CNIT Forest
01/12/2023 : Le 35ème congrès de la SFRO est annoncé pour novembre 2024 au CNIT Forest de Paris La Défense. D’ici-là, le replay de la session 2023 est toujours disponible.

IRM pédiatrique : le feed & wrap comme alternative à la sédation profonde
14/05/2024 : La sédation profonde peut provoquer des effets secondaires pour les nouveau-nés qui doivent faire l'objet d'une IRM. Une étude publiée dans la Revue European Radiology évalue la qualité d’image obtenue en utilisant la technique d’immobilisation Feed and Wrap. Les chercheurs y voient une méthode efficace avec une qualité d’image significative et annoncent la fin de la sédation profonde pour les nouveau-nés candidats à l’IRM.