La science des données, une discipline « en mouvement »

La démocratisation des big data remet sur le devant de la scène la science des données, tout en contribuant à son développement. Mais la définition exacte de cette discipline en constante progression, située au croisement des statistiques et de l’informatique, demeure difficile à établir. Comment caractériser précisément un data scientist ? Et, par voie de conséquence, comment optimiser sa formation ? Les universités, premières concernées, se sont emparées de la question.

Discipline qui n’est certes pas nouvelle, la science des données « c’est l’art de répondre à des questions d’importance avec des données ». On doit cette jolie définition à l’Université Johns Hopkins, pour qui le rôle du data scientist est d’identifier des questions pertinentes, de rassembler les données permettant d’y répondre, de développer des modèles statistiques et, enfin, de communiquer les résultats de sorte qu’ils puissent être exploités. Un point de vue partagé par l’Université Georgetown, qui offre un cursus Data Science & Analytics depuis l’automne 2015.

Le lancement de formations spécifiquement dédiées à la science des données reste cependant trop récent pour en mesurer les apports. Car si tout le monde s’accorde sur le fait que cette discipline nécessite des compétences à la fois en statistiques et en informatique, il n’existe pas encore dans les milieux académiques de référentiel commun permettant de formaliser les caractéristiques du data scientist. Consciente de cette limitation purement théorique, l’Université de Washington a contourné le problème en reconnaissant la science des données comme discipline « en constante évolution » et en adoptant pour ses étudiants en doctorat une approche interdisciplinaire, exhaustive et pratique.

Si on ne sait pas encore exactement de quoi les formations des « scientifiques des données » doivent être faites, les entreprises, elles, peuvent éprouver quelques doutes au moment de recruter. Dans cet article, le consultant Barry Schaeffer leur livre quelques conseils pragmatiques pour tirer le meilleur parti de la science des données. Notamment celui de ne pas considérer les big data comme une réponse miracle à l’ensemble de leurs problématiques.

 

Lire l’article (en anglais)

 

En complément :

Une infographie (en anglais) sur l’évolution du métier de data scientist ces trois dernières années,

un article détaillant les compétences pour devenir data scientist

et un autre (en anglais) présentant la définition personnelle d’un data scientist par l’une d’entre elles, Hilary Mason

 

À lire sur Business Analytics Info :

« Les entreprises en 2016 ne peuvent plus ignorer la science des données »

et

« Reconnaître un bon data scientist »