Publicité

Un nouvel outil d'extraction de données spécialisé en radiologie

15/07/2025
De Bruno Benque
Illustration Un nouvel outil d'extraction de données spécialisé en radiologie

Les méthodes d’élaboration des grands modèles de langage sont basées sur des règles qui ne traitent pas efficacement les données non standardisées. Des chercheurs britanniques présentent, dans un article publié dans la Revue European Radiology, RADEX, le nouvel outil d’extraction de données radiologiques. Ils décrivent une étude qui éprouve RADEX sur un vaste ensemble de comptes rendus d’échographie thyroïdienne.

Les méthodes d’élaboration des grands modèles de langage sont basées sur des règles qui ne traitent pas efficacement les données non standardisées. Des chercheurs britanniques présentent, dans un article publié dans la Revue European Radiology, RADEX, le nouvel outil d’extraction de données radiologiques. Ils décrivent une étude qui éprouve RADEX sur un vaste ensemble de comptes rendus d’échographie thyroïdienne.

Les récentes avancées en traitement automatique du langage (TAL), telles que le machine learning (ML) ou le deep learning (DL) et notamment les grands modèles de langage (MLL) comme BERT et ChatGPT, ont ravivé l'intérêt pour l'extraction automatisée d'informations contenues dans les dossiers patients.

Les méthodes d’élaboration des grands modèles de langage peu efficaces pour traiter les données non structurées

Les modèles de langage spécifiques à un domaine ont montré des résultats prometteurs pour des tâches telles que la classification de textes, la reconnaissance de caractères et la synthèse, en réentraînant le modèle BERT de base à partir de textes cliniques ou de littérature biomédicale. Malgré le potentiel des méthodes ML et DL, le manque de données d'apprentissage spécifiques au domaine et les préoccupations liées à la sécurité, à la fiabilité, à l'explicabilité et aux biais ont limité leur mise en œuvre généralisée.

Pour ces raisons, les méthodes basées sur des règles, qui utilisent les connaissances humaines pour créer des modèles informatiques, restent populaires en médecine. Des modèles bien conçus peuvent atteindre des performances similaires à celles des techniques ML/DL, mais les approches basées sur des règles réside dans la difficulté de développer des modèles robustes, qui nécessite généralement une collaboration interdisciplinaire entre les experts techniques qui construisent le modèle et les experts cliniques qui apportent leur expertise dans l’interprétation des données.

Des regex se montrent efficaces mais difficiles à construire et à maintenir

Les bases de données existantes telles que l'Unified Medical Language System (UMLS) ou le Radiology Lexicon (RadLex) peuvent être utilisées dans des méthodes basées sur des dictionnaires pour identifier les termes médicaux. Mais le recours aux dictionnaires seuls ne permet souvent pas de saisir les nuances cliniques, la variabilité linguistique et le contexte, nécessaires à la classification des comptes rendus dans le cadre de tâches de recherche et d'audit sur mesure. Dans ce cas, une ingénierie manuelle des connaissances est nécessaire pour définir des règles personnalisées répondant aux exigences spécifiques de la tâche.

Ces règles élaborées manuellement sont généralement définies à l'aide du cadre établi des « expressions régulières » - regex – formé par des séquences de lettres et de caractères spéciaux. Les regex offrent une méthode efficace et flexible pour la correspondance de modèles, mais leur construction et leur maintenance sont complexes, car il n'existe actuellement aucune méthode standardisée pour leur génération et leur évaluation.

RADEX, le nouvel outil d’extraction de données radiologiques

ImageDans une étude publiée dans la Revue European Radiology, des chercheurs britanniques présentent un nouvel outil basé sur des règles pour l'extraction de données radiologiques (RADEX). Il standardise et simplifie la construction de modèles d'expressions régulières grâce à une syntaxe de haut niveau et un protocole de raffinement itératif. Cela permet de traduire efficacement les connaissances du domaine clinique en modèles informatiques pour l'annotation automatisée des données et la classification des rapports. RADEX encourage une approche systématique pour élaborer des stratégies de recherche robustes, complètes et reproductibles. 

L’extraction des données à partir de comptes rendus radiologiques non structurés (radiographies, IRM, scanner, échographie) et d'autres documents cliniques (notes cliniques, rapports d'incident, comptes rendus d’anapath et de cytologie, etc.) est fiable et répond aux défis posés par les méthodes précédentes, qui manquaient de transparence et de reproductibilité.

Un article qui éprouve RADEX sur un vaste ensemble de comptes rendus d’échographie thyroïdienne

RADEX s'adresse aux chercheurs biomédicaux et aux professionnels de santé sans expérience préalable en TAL. Il offre une solution pratique, rapide, flexible et gratuite, intégrable aux systèmes cliniques existants. Le flux de travail typique de RADEX est démontré sur un vaste ensemble de données de comptes rendus d'échographie thyroïdienne, un exemple pertinent de rapports non structurés, au langage variable et présentant un large éventail d'indications diagnostiques.

Dans cette étude, 16 246 comptes rendus d'échographie thyroïdienne ont été classés selon 14 critères, couvrant les pathologies diffuses et focales courantes, ainsi que la classification des nodules. Les résultats ont été évalués par rapport à 202 tags de référence, avec le consensus de trois experts indépendants. L'ensemble de données anonymisées produit pourrait être utilisé pour l'évaluation du service rendu, l'amélioration de la cohérence des comptes rendus ou la recherche.

L'objectif de cette étude est de développer et d'évaluer RADEX, qui vise à fournir une solution évolutive, conviviale et rapide pour l'extraction d'informations et la classification de comptes rendus dans de grands ensembles de données, comme c’est le cas dans l'échographie thyroïdienne.

SUR LE MÊME THÈME

IA & Données
Une checklist pour l'élaboration des outils d'IA en imagerie mise à jour
Abonné(e)

Une checklist pour l'élaboration des outils d'IA en imagerie mise à jour

Si les outils et modèles d’intelligence artificielle (IA) sont aujourd’hui largement répandus, leur précision et leur robustesse sont encore inégales. Pour faire évoluer cette discipline, des documents de recommandations relatives à l’élaboration de ces outils font office de référence pour leurs aut...

03/04/2026 -

IA & Données
La radiologie française parle aux européens des apports de l'IA dans l'imagerie d'urgence

La radiologie française parle aux européens des apports de l'IA dans l'imagerie d'urgence

Vu dans la newsletter de Mars 2026 publiée par la Société Française de Radiologie (SFR), un retour sur la session “ESR meets France” qui a réuni, à l’occasion de l’European Congress of Radiology (ECR), des experts français et européens autour d’un sujet désormais central pour l’imagerie en soins aig...

01/04/2026 -

IA & Données
L'IA peut-elle jouer un rôle dans le burn-out des radiologues ?
Abonné(e)

L'IA peut-elle jouer un rôle dans le burn-out des radiologues ?

L’IA peut-elle permettre de réduire le burn-out des radiologues ? Il semble que non, si l’on en croit une revue de la littérature publiée dans la Revue European Radiology, qui tente de trouver des preuves des bienfaits de l’IA sur la santé mentale des radiologues. Les chercheurs estiment qu’une meil...

30/03/2026 -

IA & Données
La plateforme ATLAS d'IA en radiologie intègre plus de 230 fiches de modèles

La plateforme ATLAS d'IA en radiologie intègre plus de 230 fiches de modèles

La Radiological Society of North America (RSNA) annonce la présence de plus de 230 fiches de modèles et de jeux de données concernant 31 sous-spécialités dans sa bibliothèque annotée de systèmes d'IA (ATLAS), offrant ainsi à la communauté radiologique les outils nécessaires pour rendre la recherche...

27/03/2026 -

IA & Données
Une solution d'aide au diagnostic validée par la FDA pour le dépistage du cancer du poumon

Une solution d'aide au diagnostic validée par la FDA pour le dépistage du cancer du poumon

Median Technologies vient d'annoncer avoir obtenu l’autorisation de la FDA pour eyonis® LCS, le premier logiciel dispositif médical de détection et diagnostic basé sur l’IA pour le dépistage du cancer du poumon.

10/02/2026 -

IA & Données
Un modèle de segmentation des images IRM obtient le Prix Alexander Magulis 2025
Abonné(e)

Un modèle de segmentation des images IRM obtient le Prix Alexander Magulis 2025

Après la tomodensitométrie, c’est au tour des images IRM de bénéficier de la segmentation automatisée. TotalSegmentator MRI, un modèle entraîné à la fois sur des images IRM et TDM, a remporté le Prix Alexander R. Margulis 2025 de la RSNA. Il s’agit d’un outil très précis permettant notamment d’obten...

02/12/2025 -

IA & Données
Un assistant clinique IA qui optimise le workflow médical
Abonné(e)

Un assistant clinique IA qui optimise le workflow médical

Microsoft vient d’annoncer la disponibilité en France de Microsoft Dragon Copilot, un assistant clinique IA conçu pour simplifier la documentation, faciliter la recherche d’informations et automatiser des tâches.

08/10/2025 -

LETTRE D'INFORMATION

Ne manquez aucune actualité en imagerie médicale et radiologie !

Inscrivez-vous à notre lettre d’information hebdomadaire pour recevoir les dernières actualités, agendas de congrès, et restez informé des avancées et innovations dans le domaine.