Les métiers de la data transcendent les domaines d’expertise

Avant même de parler des technologies nécessaire pour travailler les données, il est nécessaire de clarifier les définitions même des métiers de la data. Comprendre la différence entre un data engineer, un data analyst et un data scientist est essentiel pour comprendre comment leurs expertises dans différents domaines sont transposables aux métiers de la data. 

Une expertise et une volonté d’apprendre pour travailler la data

De nombreux experts de la data ne viennent pas des statistiques ou des mathématiques, mais ont su transposer leur expertise pour en faire un atout dans l’analyse de données. Il n’ont pas hésité à se former tout au long de leur carrière, comme par exemple le Dr. Rebecca Pope, head of data science and engineering chez KPMG. Son domaine d’origine est les neurosciences mais elles s’est ensuite formée à la programmation, et particulièrement au langage Python.

Pour Rebecca Pope un statisticien et un data scientist sont bien différents : « Un statisticien cherche à construire un modèle qui établit une relation entre une variable et un résultat. Un data scientist veut aller plus loin : prédire. Les scientifiques de données entrainent des modèles sur des données afin que ces modèles puisse prédire le futur avec autant de précision que possible. »

Responsabilités comparées du data engineer, data analyst et data scientist

La définition de Rebecca Pope du métier de data engineer : « la représentation et le mouvement des données afin qu’elles soient consommables et utilisables », ce qui implique de transformer les données brutes, les nettoyer, les déplacer dans une base de données, les tagger et les préparer pour les prochaines étapes.

Le data analyst s’appuie sur le travail de préparation des données réalisé par le data scientist. Sa responsabilité est de faire le lien avec le business de l’entreprise pour comprendre les données et les rendre compréhensibles et interprétables par la visualisation.

Le data scientist entraîne des programmes de machine learning pour créer des modèles qui permettront d’extrapoler à partir des données pour suggérer des actions utiles au business. Des compétences poussées en mathématiques et en visualisation de données son clés à ce poste, tout comme un bon relationnel avec les métiers de l’entreprise pour leur présenter les modèles de données et les encourager à les utiliser.

Les métiers de la data sont donc destinés à des experts « couteaux suisse » capables de se former et surtout de poser les bonnes questions pour progresser dans leur pratique et dans leur compréhension des enjeux business.

Lire l’article