Reconnaître un bon data scientist

Une tête bien faite plutôt qu’une tête bien pleine. L’adage s’applique aussi au data scientist idéal, selon Jerry Overton, fondateur du CSC advanced analytics lab. Pour lui, la qualité la plus importante à attendre d’un data scientist est sa capacité à prouver des hypothèses qu’il a formulées à partir d’un jeu de données, tout en étant en mesure d’en fournir une interprétation utile.

Les compétences du data scientist se situent à l’intersection de l’informatique, des statistiques mais aussi de l’expertise sur un domaine métier. Mais être un bon data scientist, en pratique, ne se limite pas à ces connaissances-là, estime l’un d’eux, Jerry Overton, dans une tribune publiée sur le site O’Reilly.

L’écriture de logiciels fonctionnels basés sur l’analyse des données requiert ainsi de maîtriser des techniques d’ingénierie bien spécifiques ; la compréhension des algorithmes d’apprentissage automatique nécessite d’être complétée par une aptitude à évaluer des hypothèses ; enfin, et peut-être plus important encore, les capacités relationnelles du data scientist doivent lui permettre d’entraîner avec lui des experts dans une expérimentation agile.

 

L’algorithme, un instrument scientifique pour le data scientist

 

Dans sa note argumentée, Jerry Overton relate un cas pratique. Il s’agissait de mesurer la satisfaction de ses collaborateurs à partir d’une analyse de données. En travaillant avec un expert en ressources humaines, l’auteur a abouti à un modèle mathématique adapté (arbre de décision) permettant de détecter un employé malheureux à partir d’un simple questionnaire. Il conclut avec une analogie à méditer : l’algorithme est au data scientist ce que le microscope composé est au biologiste. Autrement dit un instrument qu’il doit bien comprendre pour être en mesure de produire grâce à lui des connaissances utiles dans le monde réel.

 

Lire l’article (en anglais)

 

En complément :

Un article (en anglais) sur les tendances 2016 en terme de science des données 

et une analyse (en anglais) sur ce que font en pratique les data scientists.

 

À lire sur Business Analytics Info :

« Promouvoir les talents internes, une solution face à la pénurie de data scientists »

et

« Le data scientist : multi-casquette et (déjà) sous pression ».