Le produit minimum viable (MVP), meilleur allié de l’apprentissage automatique

Les modèles d’apprentissage automatique impliquent généralement le traitement de grands volumes de données multidimensionnelles. Pour maximiser leurs chances de réussite, il est intéressant de les tester au plus tôt au moyen d’un produit minimum viable (MVP) et d’investir suffisamment dans le diagnostic et la correction de leurs faiblesses. Explications.

Le développement de modèles d’apprentissage automatique (machine learning), qui s’appuient intensivement sur les données, se révèle plus complexe que celui de logiciels traditionnels, auxquels on peut généralement appliquer une méthodologie « sobre » de lean development. Mais dans le premier cas comme dans le second, la conception d’un produit minimum viable (MVP pour Minimum Viable Product) s’avère indispensable à la réussite de tout projet. Outre l’exploration du marché et des défis à relever, cette étape préliminaire permet d’identifier les éventuelles faiblesses d’un modèle d’apprentissage, le plus souvent liées à une faible qualité des données ou à un déploiement inapproprié, voire aux deux en même temps.

 

Augmenter les chances de succès d’un projet d’apprentissage automatique

 

Sans l’évaluation d’un MVP, tout investissement futur risque de se traduire par un échec. En outre, les projets de machine learning se traduisent par une courbe de retour sur investissement assez singulière, en forme de « S » (lente croissance, forte croissance, lente croissance), alors que les décideurs sont habitués à une évolution linéaire du ROI. En effet, établir les bases du Machine Learning peut durer assez longtemps, suivi par une brusque phase de croissance des revenus au fil de l’affinage des problèmes (la courbe du s). Souvent trop, les décideurs choisissent d’interrompre les frais juste avant d’atteindre cette phase de montée en flèche… Or, au-delà de la main d’œuvre, certains investissements — les coûts associés à la collecte, au nettoyage, à l’annotation et au stockage des données, ou ceux relatifs à la puissance de calcul, à la modélisation et au déploiement — doivent être anticipés dès l’élaboration d’un produit minimum viable.

Plusieurs conditions sont requises pour augmenter les chances de succès d’un projet d’apprentissage automatique. Les data scientists, tout d’abord, plus familiers avec la modélisation qu’avec l’ingénierie, doivent accepter d’évaluer les données et le modèle séparément en cas de résultat inattendu. Les dirigeants d’entreprise doivent, quant à eux, se montrer patient vis-à-vis du retour sur investissement d’un MVP, car les produits de machine learning aboutissent seulement après plusieurs étapes complexes. De plus, il est nécessaire de comprendre que le diagnostic des faiblesses d’un modèle d’apprentissage automatique est coûteux du fait de l’extrême difficulté à expliquer ses mécanismes sous-jacents, mais aussi que cette évaluation est cruciale pour la pérennité du modèle. Enfin, les entreprises doivent s’assurer que les connaissances sont convenablement partagées entre les différentes personnes d’une équipe afin de parer au départ éventuel d’un membre clé.

 

Lire l’article

 

En complément :

un article (en anglais) au sujet des modèles d’apprentissage automatique

et un autre (en anglais) à propos de l’investissement dans l’intelligence artificielle