L'IA montre ses qualités pour la lecture des mammographies de dépistage
MARDI 05 SEPTEMBRE 2023
À l’aide d’une évaluation standardisée, des chercheurs britanniques ont comparé les performances d’un algorithme d’intelligence artificielle (IA) avec des lecteurs humains pour la lecture de mammographies de dépistage. Les résultats de leurs travaux, qui font état d’une nécessaire assurance qualité de l’IA, ont été publiés dans la Revue Radiology.

Les procédures de dépistage du cancer du sein par mammographique font intervenir deux relecteurs d’examens, pour une meilleure sensibilité et spécificité, et afin notamment de réduire les faux positifs et les biopsies inutiles.
Peut-on faire confiance à l’IA dans les procédures de relecture des mammographies de dépistage ?
Dans un contexte de pénurie de radiologues qualifiés, l’intelligence artificielle (IA) est appelée en renfort, bien qu’elle ne fasse pas totalement l’unanimité chez les radiologues. « Il y a beaucoup de pression pour déployer rapidement l'IA afin de résoudre ces problèmes, mais nous devons bien faire les choses pour protéger la santé des femmes », remarque le Pr Yan Chen, professeur de dépistage numérique à l'Université de Nottingham (Royaume-Uni).
Le professeur Chen et son équipe de recherche ont réalisé une étude, publiée dans la Revue Radiology, au cours de laquelle ils ont utilisé des ensembles d’examens issus de l’évaluation de l’assurance qualité Personal Performance in Mammographic Screening, ou PERFORMS, utilisée par le National Health Service Breast Screening Program (NHSBSP) du Royaume-Uni, pour comparer les performances des lecteurs humains avec l’IA. Un seul set PERFORMS comprend 60 examens difficiles du NHSBSP avec des résultats anormaux, bénins et normaux. Pour chaque mammographie test, le score du lecteur est comparé aux résultats de l’IA.
Une étude comparative montre des résultats similaires en sensibilité et en spécificité entre le lecteur IA et le lecteur humain
« Il est vraiment important que les lecteurs humains travaillant dans le domaine du dépistage du cancer du sein démontrent des performances satisfaisantes, poursuit-t-elle. Il en sera de même pour l’IA une fois qu’elle entrera dans la pratique clinique. » L’équipe de recherche a scruté 120 mammographies de dépistage pour évaluer les performances de l’algorithme d’IA. Les chercheurs ont comparé les résultats des tests d'IA avec les scores de 552 lecteurs humains, dont 315 (57 %) radiologues certifiés et 237 lecteurs non-radiologues, dont 206 Manipulateurs d’électroradiologie médicale (MERM) et 31 cliniciens du sein.
« Les 552 lecteurs de notre étude représentent 68 % des lecteurs du NHSBSP, ce qui fournit une comparaison solide des performances entre les lecteurs humains et l'IA », ajoute le Pr Chen. En traitant chaque sein séparément, il y avait 161/240 (67 %) seins normaux, 70/240 (29 %) seins présentant des tumeurs malignes et 9/240 (4 %) seins bénins. Les masses étaient la caractéristique mammographique maligne la plus courante (45/70 ou 64,3 %), suivies des calcifications (9/70 ou 12,9 %), des asymétries (8/70 ou 11,4 %) et des distorsions architecturales (8/70 ou 11,4 %). La taille moyenne des lésions malignes était de 15,5 mm.
Mettre en place un processus d’assurance qualité de l’IA pour éviter les dérives
Aucune différence de performance n’a été observée entre les lecteurs IA et les lecteurs humains dans la détection du cancer du sein dans 120 examens. Les performances du lecteur humain ont démontré une sensibilité moyenne de 90 % et une spécificité de 76 %. L’IA était comparable en sensibilité (91 %) et en spécificité (77 %) à celle des lecteurs humains.
« Les résultats de cette étude fournissent des preuves solides que l'IA pour le dépistage du cancer du sein peut être aussi efficace que les lecteurs humains, remarque le Pr Chen. Je pense qu’il est trop tôt pour dire précisément comment nous utiliserons à terme l’IA dans le dépistage du cancer du sein. Les grands essais cliniques prospectifs en cours nous en diront davantage. Mais quelle que soit la manière dont nous utilisons l’IA, la capacité à assurer une surveillance continue des performances sera cruciale pour son succès. »
Elle reconnaît toutefois que les performances de l’IA peuvent dériver avec le temps et que les algorithmes peuvent être affectés par les changements dans l’environnement d’exploitation. « Il est essentiel que les centres d’imagerie disposent d’un processus permettant d’assurer une surveillance continue de l’IA une fois qu’elle fera partie de la pratique clinique, conclut-elle. Il n'existe à ce jour aucune autre étude ayant comparé un si grand nombre de performances de lecteurs humains dans des ensembles de tests d'assurance qualité de routine à l'IA. Cette étude peut donc fournir un modèle pour évaluer les performances de l'IA dans un environnement réel."
Bruno Benque avec RSNA