Publicité

Un nouvel outil d'extraction de données spécialisé en radiologie

15/07/2025
De Bruno Benque
Illustration Un nouvel outil d'extraction de données spécialisé en radiologie

Les méthodes d’élaboration des grands modèles de langage sont basées sur des règles qui ne traitent pas efficacement les données non standardisées. Des chercheurs britanniques présentent, dans un article publié dans la Revue European Radiology, RADEX, le nouvel outil d’extraction de données radiologiques. Ils décrivent une étude qui éprouve RADEX sur un vaste ensemble de comptes rendus d’échographie thyroïdienne.

Les méthodes d’élaboration des grands modèles de langage sont basées sur des règles qui ne traitent pas efficacement les données non standardisées. Des chercheurs britanniques présentent, dans un article publié dans la Revue European Radiology, RADEX, le nouvel outil d’extraction de données radiologiques. Ils décrivent une étude qui éprouve RADEX sur un vaste ensemble de comptes rendus d’échographie thyroïdienne.

Les récentes avancées en traitement automatique du langage (TAL), telles que le machine learning (ML) ou le deep learning (DL) et notamment les grands modèles de langage (MLL) comme BERT et ChatGPT, ont ravivé l'intérêt pour l'extraction automatisée d'informations contenues dans les dossiers patients.

Les méthodes d’élaboration des grands modèles de langage peu efficaces pour traiter les données non structurées

Les modèles de langage spécifiques à un domaine ont montré des résultats prometteurs pour des tâches telles que la classification de textes, la reconnaissance de caractères et la synthèse, en réentraînant le modèle BERT de base à partir de textes cliniques ou de littérature biomédicale. Malgré le potentiel des méthodes ML et DL, le manque de données d'apprentissage spécifiques au domaine et les préoccupations liées à la sécurité, à la fiabilité, à l'explicabilité et aux biais ont limité leur mise en œuvre généralisée.

Pour ces raisons, les méthodes basées sur des règles, qui utilisent les connaissances humaines pour créer des modèles informatiques, restent populaires en médecine. Des modèles bien conçus peuvent atteindre des performances similaires à celles des techniques ML/DL, mais les approches basées sur des règles réside dans la difficulté de développer des modèles robustes, qui nécessite généralement une collaboration interdisciplinaire entre les experts techniques qui construisent le modèle et les experts cliniques qui apportent leur expertise dans l’interprétation des données.

Des regex se montrent efficaces mais difficiles à construire et à maintenir

Les bases de données existantes telles que l'Unified Medical Language System (UMLS) ou le Radiology Lexicon (RadLex) peuvent être utilisées dans des méthodes basées sur des dictionnaires pour identifier les termes médicaux. Mais le recours aux dictionnaires seuls ne permet souvent pas de saisir les nuances cliniques, la variabilité linguistique et le contexte, nécessaires à la classification des comptes rendus dans le cadre de tâches de recherche et d'audit sur mesure. Dans ce cas, une ingénierie manuelle des connaissances est nécessaire pour définir des règles personnalisées répondant aux exigences spécifiques de la tâche.

Ces règles élaborées manuellement sont généralement définies à l'aide du cadre établi des « expressions régulières » - regex – formé par des séquences de lettres et de caractères spéciaux. Les regex offrent une méthode efficace et flexible pour la correspondance de modèles, mais leur construction et leur maintenance sont complexes, car il n'existe actuellement aucune méthode standardisée pour leur génération et leur évaluation.

RADEX, le nouvel outil d’extraction de données radiologiques

ImageDans une étude publiée dans la Revue European Radiology, des chercheurs britanniques présentent un nouvel outil basé sur des règles pour l'extraction de données radiologiques (RADEX). Il standardise et simplifie la construction de modèles d'expressions régulières grâce à une syntaxe de haut niveau et un protocole de raffinement itératif. Cela permet de traduire efficacement les connaissances du domaine clinique en modèles informatiques pour l'annotation automatisée des données et la classification des rapports. RADEX encourage une approche systématique pour élaborer des stratégies de recherche robustes, complètes et reproductibles. 

L’extraction des données à partir de comptes rendus radiologiques non structurés (radiographies, IRM, scanner, échographie) et d'autres documents cliniques (notes cliniques, rapports d'incident, comptes rendus d’anapath et de cytologie, etc.) est fiable et répond aux défis posés par les méthodes précédentes, qui manquaient de transparence et de reproductibilité.

Un article qui éprouve RADEX sur un vaste ensemble de comptes rendus d’échographie thyroïdienne

RADEX s'adresse aux chercheurs biomédicaux et aux professionnels de santé sans expérience préalable en TAL. Il offre une solution pratique, rapide, flexible et gratuite, intégrable aux systèmes cliniques existants. Le flux de travail typique de RADEX est démontré sur un vaste ensemble de données de comptes rendus d'échographie thyroïdienne, un exemple pertinent de rapports non structurés, au langage variable et présentant un large éventail d'indications diagnostiques.

Dans cette étude, 16 246 comptes rendus d'échographie thyroïdienne ont été classés selon 14 critères, couvrant les pathologies diffuses et focales courantes, ainsi que la classification des nodules. Les résultats ont été évalués par rapport à 202 tags de référence, avec le consensus de trois experts indépendants. L'ensemble de données anonymisées produit pourrait être utilisé pour l'évaluation du service rendu, l'amélioration de la cohérence des comptes rendus ou la recherche.

L'objectif de cette étude est de développer et d'évaluer RADEX, qui vise à fournir une solution évolutive, conviviale et rapide pour l'extraction d'informations et la classification de comptes rendus dans de grands ensembles de données, comme c’est le cas dans l'échographie thyroïdienne.

SUR LE MÊME THÈME

IA & Données
Un assistant clinique IA qui optimise le workflow médical
Abonné(e)

Un assistant clinique IA qui optimise le workflow médical

Microsoft vient d’annoncer la disponibilité en France de Microsoft Dragon Copilot, un assistant clinique IA conçu pour simplifier la documentation, faciliter la recherche d’informations et automatiser des tâches.

08/10/2025 -

IA & Données
Comment la DRIMbox améliore la qualité et la pertinence des examens d'imagerie

Comment la DRIMbox améliore la qualité et la pertinence des examens d'imagerie

Le programme Ségur Vague 2 pour l’imagerie connaît aujourd’hui son premier point d’étape avec l’enregistrement définitif des candidats au référencement RIS et DRIMbox. Nous avons rencontré Jean-Marc Chevilley, Directeur de Projet au sein de la Délégation au Numérique en Santé, qui est le pilote prin...

07/10/2025 -

IA & Données
Dr Data accélère l’IA et la recherche grâce au e-consentement en radiologie

Dr Data accélère l’IA et la recherche grâce au e-consentement en radiologie

Depuis la publication de l'AI Act, l'écosystème de l’imagerie médicale doit se préparer à évoluer, notamment pour gérer le consentement et l’opposition des patients. L'équipe de Dr Data a mis à disposition son expertise en protection des données de santé pour construire une solution et des processus...

04/10/2025 -

IA & Données

Trouver le modèle qui puisse efficacement intégrer l'IA dans le flux de travail du radiologue

Le médecin-chercheur Eric J. Topol et le spécialiste en IA de Harvard, Pranav Rajpurkar plaident en faveur d'une séparation claire des rôles entre les systèmes d'IA et les radiologues dans un éditorial publié dans la Revue Radiology. Ils proposent un cadre que les radiologues doivent adapter à leurs...

28/08/2025 -

IA & Données
Un acteur français de l'IA propose deux outils TDM pour la détection du cancer

Un acteur français de l'IA propose deux outils TDM pour la détection du cancer

Gleamer, acteur française de l’IA médicale, a lancé en juillet dernier sa suite OncoView destinée à assister les radiologues dans la détection précoce du cancer par densitométrie (TDM).

22/08/2025 -

IA & Données
Un réseau de radiologues français conclut un accord avec un fournisseur d'IA pour le diagnostic

Un réseau de radiologues français conclut un accord avec un fournisseur d'IA pour le diagnostic

Gleamer a annoncé, le 10 Juillet 2025, la signature d’un partenariat stratégique avec le réseau France Imageries Territoires (FIT) pour le déploiement des solutions Gleamer Copilot® dans l’ensemble des centres d’imagerie du réseau FIT.

29/07/2025 -

IA & Données
Les comptes rendus radiologiques ne sont pas près de passer par GPT-4
Abonné(e)

Les comptes rendus radiologiques ne sont pas près de passer par GPT-4

Les grands modèles de langage multimodaux seraient-ils capables de réaliser des comptes rendus radiologiques ? Des résultats d’essais contradictoires troublent le ressenti sur les possibilités de GPT-4V, un modèle qui se concentre uniquement sur la précision diagnostique. Une étude publiée dans la R...

21/07/2025 -

LETTRE D'INFORMATION

Ne manquez aucune actualité en imagerie médicale et radiologie !

Inscrivez-vous à notre lettre d’information hebdomadaire pour recevoir les dernières actualités, agendas de congrès, et restez informé des avancées et innovations dans le domaine.