Les secrets du système de recommandation Netflix

Outre un vaste catalogue de contenus, Netflix propose un système de recommandation permettant à ses abonnés de découvrir d’autres programmes susceptibles de leur plaire. Sur quelles données se basent ces prédictions ? Trois ingrédients font le succès des suggestions de la célèbre plateforme de streaming.

80 % des contenus visionnés sur Netflix proviennent du moteur de recommandation. C’est donc généralement un algorithme qui décide des programmes que regardent les abonnés. Un constat peu surprenant quand on sait que le moteur, loin de se cantonner au seul genre des émissions, s’appuie sur un large éventail d’informations pour réaliser ses prédictions. D’une part, Netflix dispose des données relatives aux habitudes de visionnage de ses quelque 250 millions de profils actifs : ce qu’ils regardent, les programmes visionnés avant et après, l’heure habituelle des visionnages, etc. Et d’autre part, des dizaines de collaborateurs passent quotidiennement les contenus au crible pour taguer chaque minute en fonction de critères variés, notamment d’éléments de narration.

 

2000 communautés de goûts

 

Ces deux sources de données alimentent des algorithmes de machine learning. C’est précisément ce qui aide Netflix à comprendre l’importance des habitudes de visionnage de ses abonnés, pour constituer des « communautés de goûts ». Environ 2000 sont répertoriées et c’est en fonction de son appartenance à un de ses groupes que l’abonné se voit proposer tel ou tel contenu. Et pour preuve de l’efficacité du système, une statistique : un abonné sur huit qui visionne sur Netflix une série de Marvel n’avait auparavant jamais regardé un programme de ce genre !

 

 

Lire l’article (en anglais)

 

En complément :

Le travail humain derrière la performance des algorithmes,

Spotify mise sur les startups spécialisées dans le machine learning.