Le Deep Learning en imagerie médicale

L’apprentissage Profond (Deep Learning) en imagerie médicale.

Nous avons vu que les algorithmes de machine learning permettaient de créer des prédictions, en laissant le modèle apprendre par lui même au contact des données fournies et en s’affranchissant ainsi des innombrables lignes de codes qu’il aurait fallu rentrer pour obtenir la même prédiction avec un algorithme traditionnel.

L’apprentissage machine permet la réalisation automatique de tâches essentielles en imagerie médicale :

– Détection des anomalies (Computer-Aided Detection – CADe)

– Caractérisation des anomalies détectées (Computer-Aided Diagnosis-CADx)

– Segmentation d’organe

– Suivie de l’évolution de images (cancérologie)

Parmi les algorithmes d’apprentissage, les Réseaux Neuronaux Profonds Convolutifs (RNC) sont à l’origine d’un progrès majeur dans la réalisation de ces tâches réalisant une révolution dans le domaine. Essayons de comprendre pourquoi.

Jusqu’à récemment les systèmes « classiques » d’apprentissage en reconnaissance de forme étaient composés de deux blocs :

  • Un extracteur de caractéristique (Feature extractor), programmé à la main
  • Un classifieur entrainable, comme une Machine à Vecteur de Support, pour classer l’image

Reprenons notre exemple classique de la caractérisation automatique d’un nodule pulmonaire en deux classes : bénin/malin.

L’étape d’extraction de caractéristique correspond ici à 1. segmenter le nodule puis 2. choisir et extraire celles de ses caractéristiques qui nous semblent pertinentes pour le classer en bénin/malin : contours, densité, rehaussement, rugosité, entropie … Ces caractéristiques sont regroupées en vecteurs.

L’étape suivante correspond à choisir l’algorithme de machine learning pour traiter ces vecteurs de manière à classer le nodule.

Or segmenter l’image et déterminer quelles sont les bonnes caractéristiques à extraire pour répondre à la question sont des tâches particulièrement complexes, sources d’erreurs potentielles. En effet il est quasiment impossible de prouver qu’on a choisi les caractéristiques optimales pour résoudre tel ou tel problème. C’est précisément là que les Réseaux de Neurones Convolutifs vont nous permettre de franchir une étape décisive.

Etapes classiques de Machine learning

Parmi les algorithmes d’apprentissage machine, le Réseau de Neurone Convolutif introduit un changement de paradigme en synthétisant les étapes 1 et 2.

Le Réseau de Neurone Convolutif change complètement la donne : il synthétise ces deux étapes en réalisant à la fois l’extraction des caractéristiques de l’image et la classification. Plus besoin d’extraire les données de l’image pour ensuite les analyser. En Deep learning, le réseau prend les pixels de l’image ou d’une région de l’image comme valeur d’entrée (input) et la transforme à travers de multiples couches de calculs (d’où le terme « profond ») en élément de décision/classification (output).

C’est dans ces couches intermédiaires, dites « cachées », que prend place l’extraction des caractéristiques de l’image qui ne sont pas explicitement programmées par le concepteur du réseau mais apprises par le réseau grâce aux données labellisées fournies durant la phase d’entrainement. Le processus est réalisé de bout en bout par la machine (« end-to-end » pour les anglo-saxons) depuis l’analyse des données brutes à la classification des images en réalisant lui même les autres étapes.

C’est donc un profond changement de paradigme dans le domaine de la vision par ordinateur qui aboutit depuis quelques années à ces fulgurants progrès d’efficacité en matière de détection et de caractérisation des images médicales.

L’explication détaillée du fonctionnement du réseau de neurones n’est pas le sujet de ce site. De nombreuses ressources existent en ligne sur ce sujet, notamment l’excellent cours donné au Collège de France par un des inventeurs du Deep Learning, Yann LeCun.

Retenons que le système s’inspire (de loin) du vivant en utilisant des « neurones artificiels » interconnectés. Chaque neurone reçoit une somme pondérée (W) d’entrées X et active sa sortie Y lorsque cette somme dépasse un seuil. La prédiction du réseau est comparée à la sortie attendue. L’apprentissage modifie les poids « synaptiques » W de manière itérative pour minimiser l’erreur et donc obtenir une prédiction qui soit la plus proche possible du résultat attendu.

Le caractère profond vient de l’organisation du réseau en couches successives. Les couches intermédiaires sont appelées « couches cachées » (ou hidden layers). Cela permet de donner des réponses non-linéaires à une question. C’est ce qu’on appelle un réseau neuronal multicouche ou Deep Learning (DL)… ça y est vous savez ce que c’est !

Citons à nouveau Y. LeCun :

« Ce qui fait l’avantage des architectures profondes, c’est leur capacité d’apprendre à représenter le monde de manière hiérarchique. Comme toutes les couches sont entraînables, nul besoin de construire un extracteur de caractéristiques à la main. L’entraînement s’en chargera. »

Les réseaux convolutifs sont une forme particulière de réseau neuronal inspirée de celle du cortex visuel des mammifères : Les premières couches extraient des caractéristiques simples (présence de contours) que les couches suivantes combinent pour former des concepts de plus en plus complexes : assemblages de contours en motifs à de motifs en parties d’objets à de parties d’objets en objets. Ainsi le réseau extrait lui même les caractéristiques de l’image.

Deux problèmes inhérents à l’utilisation des RNC méritent d’être soulevés ici :

  1. Ils nécessitent de grandes quantités de données labellisées pour pouvoir être entrainés efficacement
  2. Les caractéristiques extraites par l’algorithme ne sont pas facilement explicitables d’où l’effet dit « boite noire » attribuée aux réseaux de neurones profonds. Cet effet pose des problèmes conceptuels, éthiques et juridiques.

Pour approfondir vos connaissances, apprendre à créer et manipuler ces réseaux nous vous proposons une sélection de ressources parmi les innombrables possibilités qu’offre la toile, bientôt une page formation.

Pour avoir un aperçu des applications en médecine du Machine Learning c’est aussi dans les tuyaux.