Santé : l’apprentissage automatique au service du diagnostic

Exploités isolément, les comptes-rendus médicaux ont assez peu de chance de révolutionner la santé publique. Mais leur potentiel analytique peut être décuplé lorsque les informations qu’ils contiennent sont regroupées et traitées en amont par un algorithme d’apprentissage automatique (machine learning). C’est ce que conclut une étude récente sur l’identification de diagnostics de cancer publiée dans le Journal of Biomedical Informatics.

Chaque jour, de nouvelles informations sont consignées dans les dossiers médicaux de milliers de patients. Les médecins y ajoutent régulièrement des annotations concernant leurs symptômes, analyses biologiques ou traitements médicamenteux afin d’optimiser leur suivi individuel. Mais le bénéfice collectif que l’on pourrait tirer de ces données a été jusqu’à aujourd’hui plutôt négligé par les acteurs de la santé. Or une publication scientifique du « Journal of Biomedical Informatics » d’avril 2016, relayée par Kevin Murnane sur le site Forbes, démontre que les informations non structurées contenues dans ces rapports médicaux peuvent être traitées efficacement par des techniques d’apprentissage automatique afin d’établir des diagnostics de cancer.

En pratique, le principal problème pour le corps médical est de construire, à partir de dossiers patients rédigés en texte libre, des bases de données structurées, indispensables pour être traitées par des outils analytiques. Il convient pour cela d’identifier et d’extraire des mots clés des rapports cliniques, une opération requérant souvent des connaissances spécialisées. Autrement dit, une tâche coûteuse en temps et en argent puisqu’elle implique une intervention humaine et qualifiée. D’où un désintérêt relatif de l’industrie de la santé pour l’extraction de connaissances dans la masse de données non structurées issues des rapports médicaux.

 

Le machine learning fait aussi bien, voire mieux, que l’expertise humaine

 

C’est sur ce point qu’intervient l’étude réalisée par une équipe de chercheurs de l’Indiana, aux États-Unis, qui a tenté d’identifier automatiquement et avec précision des diagnostics de cancer à partir d’un échantillon de 7 000 rapports cliniques. Les scientifiques ont ainsi testé différentes techniques de machine learning pour en extraire des mots-clés pertinents. Les expériences montrent que ces modèles d’apprentissage parviennent à identifier les diagnostics de cancer dans 78 % à 99 % des cas, soit aussi bien — voire mieux — que les méthodes impliquant un expert humain.

Pour Kevin Murnane, professeur émérite en sciences cognitives, cette étude sur l’identification de diagnostics de cancer pourrait facilement être transposée à d’autres domaines de la santé. L’apprentissage automatique représente donc une opportunité pour l’industrie de la santé, en transformant des données non structurées, nombreuses mais jusqu’à présent peu utilisées, en informations de grande valeur.

 

Lire l’article (en anglais)

 

En complément :

Un article (en anglais) sur les encouragements du vice-président américain Joe Biden pour lutter contre le cancer avec les big data,

et un autre sur le concours Challenge4Cancer, qui vise à promouvoir des projets de recherche utilisant l’open data dans l’étude du cancer.

 

À lire sur Business Analytics Info :

« Cancérologie et big data : vers une meilleure prise en charge du patient »

et

« Les algorithmes au secours de la santé ».