Des chercheurs testent un grand modèle linguistique qui préserve la confidentialité des données
MARDI 10 OCTOBRE 2023
Des chercheurs du National Institutes of Health Clinical Center (NIH CC) ont testé un grand modèle linguistique autre que ChatGPT pour assurer la confidentialité des données patients. Dans un article publié dans la Revue Radiology, des modèles gratuits de deep learning peuvent être formés pour comprendre et générer du texte à la manière d'un humain National Institutes of Health Clinical Center (NIH CC)tout en conservant la confidentialité.

Les grands modèles linguistiques façonnés par l’intelligence artificielle (IA) (Large Language Model -LLM), comme ChatGPT ou GPT-4, suscitent l’intérêt de nombreux secteurs d’activité. La Santé en général, et l’imagerie médicale en particulier, sont sur le qui-vive devant cet afflux d’applications sensées apporter du confort aux professionnels et aux patients. Mais ces dernières sont-elles compatibles avec les données de santé, qui sont entourées de gardes fous pour en assurer la confidentialité ?
Les grands modèles linguistiques peu enclins à préserver la confidentialité des patients
« ChatGPT et GPT-4 sont des modèles propriétaires qui nécessitent que l'utilisateur envoie des données aux sources OpenAI pour traitement, ce qui nécessiterait la désidentification des données des patients, précise l'auteur principal d’une étude sur le sujet publiée dans la Revue Radiology, le Pr Ronald M. Summers, chercheur principal dans le Département des sciences de radiologie et d’imagerie du National Institutes of Health Clinical Center (NIH CC) à Bethesda (DC – USA). La suppression de toutes les informations sur la santé des patients demande beaucoup de travail et est irréalisable pour de grands ensembles de données. »
Dans cette étude, dirigée par le Pr Pritam Mukherjee, scientifique au NIH CC, les chercheurs ont testé la faisabilité de l'utilisation d'un LLM construit localement, Vicuna-13B, pour taguer les principaux résultats des comptes rendus de radiographie pulmonaire du NIH et la base de données MIMIC (Medical Information Mart for Intensive Care), un ensemble de données accessible au public de dossiers de santé électroniques anonymisés. « Une évaluation préliminaire a montré que Vicuna, un LLM gratuit et accessible au public, se rapproche des performances de ChatGPT dans des tâches telles que la réponse à des questions multilingues », ajoute le Pr Summers.
Une étude teste un modèle local pour taguer les résultats dans des comptes rendus d’imagrie
L'ensemble de données de l'étude comprenait 3 269 comptes rendus de radiographie pulmonaire obtenus auprès de MIMIC et 25 596 comptes rendus du NIH. À l'aide de deux invites pour deux tâches, les chercheurs ont demandé au LLM d'identifier et de taguer la présence ou l'absence de 13 résultats spécifiques sur les comptes rendus de radiographie pulmonaire. Les chercheurs ont comparé les performances du LLM avec celles de deux outils d’étiquetage non LLM largement utilisés.
Une analyse statistique des résultats du LLM a montré un accord modéré à substantiel avec les programmes informatiques non-LLM. « Notre étude a démontré que les performances du LLM étaient comparables à la norme de référence actuelle, poursuit le Pr Summers. Avec la bonne invite et la bonne tâche, nous avons pu parvenir à un accord avec les outils de taguage actuellement utilisés."
Des modèles linguistiques gratuits capables de combiner des éléments du texte et des signes radiologiques
Le Pr Summers confirme donc que les LLM pouvant être exécutés localement seront utiles pour créer de vastes ensembles de données pour la recherche sur l’IA sans compromettre la vie privée des patients. « Les LLM ont bouleversé tout le paradigme du traitement du langage naturel, ajoute-t-il. Ils ont le potentiel de faire des choses que nous avons eu du mal à faire avec les modèles linguistiques traditionnels. Les outils LLM pourraient être utilisés pour extraire des informations importantes d’autres comptes rendus de radiologie textuels et dossiers médicaux, et comme outil d’identification des biomarqueurs de maladies. Mon laboratoire s'est concentré sur l'extraction de caractéristiques à partir d'images diagnostiques. Avec des outils comme Vicuna, nous pouvons extraire des caractéristiques du texte et les combiner avec des caractéristiques d’images pour les intégrer dans des modèles d’IA sophistiqués susceptibles de répondre à des questions cliniques. »
« Les LLM gratuits, respectueux de la vie privée et disponibles pour une utilisation locale changent la donne, conclut-il. Ils nous permettent vraiment de faire des choses que nous ne pouvions pas faire auparavant. »
Bruno Benque avec RSNA