Le Machine Learning, entre mythe et réalité

Si l’intelligence artificielle est à la mode, dans son sillage, le machine learning, qui consiste à fournir des données d’apprentissage à un algorithme, profite de la dynamique. Cette traduction d’un article de Daniel Tunkelang, à l’origine des algorithmes de recherche et de recommandation de LinkedIn, apporte un éclairage utile sur cette branche de l’IA.

L’auteur rappelle en premier lieu que l’algorithme ne représente qu’une partie du machine learning, celle qui précisément fait parler, mais que c’est pourtant bien la donnée qui figure au cœur du dispositif. De la qualité de son étiquetage et de sa caractérisation dépendra en effet l’efficacité du processus d’apprentissage (le fameux « garbage in/garbarge out »). C’est pourquoi, s’agissant de machine learning, l’essentiel du travail consiste à transformer les données : les nettoyer et les enrichir en caractéristiques permettant de mettre en valeur un signal pertinent. Aussi, malgré ses promesses, le deep learning ou apprentissage profond ne s’affranchira jamais entièrement de ce travail de nettoyage et de transformation des données.

 

Un système sensible à l’erreur humaine

 

En cas d’erreur, on est souvent tenté d’imputer la faute au dispositif. L’auteur souligne toutefois que si le système de machine learning faillit, ce n’est sans doute pas l’algorithme qui est en cause mais vraisemblablement une erreur humaine au niveau des données d’entraînement qui aura généré un biais. Un piège à éviter soigneusement dans la mesure où le moindre biais au sein du modèle devrait générer de nouvelles données d’entraînement susceptibles de renforcer ce biais, contribuant à la création d’une prophétie auto-réalisatrice.

 

Lire l’article

 

En complément :

De l’usage du deep learning dans la photographie,

Risques et sécurité autour du machine learning.