Le renouveau de la gestion des données

Une bonne gestion des données est une condition préalable à une analytique efficace. La gestion des données, concept générique qui englobe l’intégration, la qualité et la gouvernance des données, longtemps reléguée au second plan dans de nombreuses entreprises, revient sur le devant de la scène, avec l’entrée en masse des entreprises dans l’ère digitale.

Par Rein Mertens, Directeur des solutions métier chez SAS Pays-Bas

Les données à gérer – qui sont déjà abondantes et souvent complexes – ne cessent de se multiplier. Parallèlement, les entreprises doivent mener des actions préventives ou en temps réel et réagir plus rapidement aux développements du marché pour prendre une longueur d’avance, et la conserver. L’organisation traditionnelle du travail – celle que suit le service informatique pour fournir des rapports sur les données aux décideurs de l’entreprise – est donc remise en question.

 

Trois tendances notables

 

On peut identifier trois tendances qui ont un impact significatif sur la gestion des données.

1. L’essor du libre-service : le besoin d’agilité impose aux entreprises de combiner et d’analyser rapidement leurs propres données de façon conviviale. Nous avons déjà observé une évolution du libre-service dans le reporting, les professionnels définissant leurs propres filtres dans un rapport. Aujourd’hui, les fonctionnalités de libre-service s’étendent aux sources mêmes des données. Les utilisateurs veulent pouvoir extraire des informations de diverses sources très rapidement, sans pour autant disposer de compétences informatiques poussées. SAS® Data Loader for HadoopTM illustre parfaitement comment SAS répond à cette tendance. Grâce à cet outil, les professionnels et data scientists peuvent effectuer des opérations de préparation et de nettoyage sur de grandes quantités de données stockées dans Hadoop sans même connaître YARN ni MapReduce.

 

2. Le besoin d’une plate-forme ouverte : pour tirer des enseignements, les entreprises doivent exploiter différentes sources internes et/ou externes. L’échange de données doit être simple pour rendre également possible une « analytique en ligne de front » ou « edge analytics ». L’analytique en ligne de front fait référence aux calculs analytiques automatisés réalisés directement par un capteur ou un autre appareil, ce qui évite d’avoir à attendre le transfert des données vers un magasin centralisé. Par exemple, une éolienne peut comparer ses performances à celles des autres éoliennes d’un même parc. Les délais de réaction sont ainsi écourtés en cas de problème. L’architecture SAS® ViyaTM que nous avons récemment lancée répond précisément au besoin d’une plate-forme moderne et ouverte.

 

3. Une gestion des données suggestive : les outils modernes utilisent l’analytique pour améliorer la gestion des données. Le système peut ainsi suggérer de combiner différentes sources ou aider les utilisateurs à interpréter les données. Par ailleurs, il est désormais possible que les outils de gestion des données effectuent des comparaisons avec d’autres sources externes pour suggérer une harmonisation des colonnes, par exemple.

 

Obstacles actuels

 

Si les entreprises se transforment très vite pour suivre l’évolution constante des exigences de leurs clients, elles sont également confrontées à de nombreux défis, notamment en matière de gestion des données. Il leur est difficile de trouver le bon équilibre entre la souplesse requise et une maîtrise suffisante de la gestion. Si la balance penche trop du côté maîtrise, une informatique « fantôme » émerge alors : les utilisateurs introduisent leurs propres systèmes pour moins dépendre du service informatique et obtenir plus rapidement des informations exploitables. En revanche, un système entièrement en libre-service peut empêcher les entreprises de mettre à profit des enseignements précédemment acquis. En effet, lorsque des utilisateurs découvrent des informations intéressantes dans un jeu de données, le service informatique se charge d’automatiser le processus et de mettre au point les mécanismes de surveillance et de gestion nécessaires.

Par ailleurs, les services commerciaux et informatiques doivent travailler en étroite collaboration pour garantir les meilleurs résultats à l’entreprise, mais dans la pratique, cette tâche se révèle ardue. La plupart des dirigeants insistent sur l’importance des données, mais comment cela se traduit-il dans le reste de l’entreprise ? De nombreux projets de gestion des données sont toujours régis par le cadre réglementaire. Peu d’entreprises placent de façon proactive la gouvernance des données en tête de leurs priorités. Nous constatons souvent que les projets de gestion des données maîtresses (MDM) sont uniquement administrés par le service informatique. Bien évidemment, les collaborateurs métier ne sont pas satisfaits des résultats et les projets échouent.

Un troisième défi consiste à utiliser les outils adaptés à la gestion des données, à savoir des outils qui conviennent à la fois au service informatique et aux utilisateurs dans l’entreprise. Selon une étude menée par Bain & Company, 56 % des entreprises ne possèdent pas les systèmes requis pour capturer les données dont ils ont besoin ou ne collectent pas des données utiles, et 66 % ne disposent pas des technologies adaptées pour stocker les données et y accéder. De plus, les outils aujourd’hui nécessaires à la préparation des données en vue de leur analyse et du reporting sont différents de ceux qu’utilisent habituellement les services informatiques dans le contexte opérationnel d’un entrepôt de données. Les entreprises doivent élaborer un plan stratégie pour la collecte et l’organisation des données, en veillant à l’aligner avec leur stratégie d’exploitation des données en vue de créer de la valeur ajoutée.

En outre, la plupart des entreprises ont du mal à apprivoiser l’Internet des objets et les énormes volumes de données qu’il génère. Pour moi, il est clair que les entreprises doivent d’abord maîtriser leurs ‘petites données’, par exemple leurs données internes et maîtresses, avant d’investir dans un projet de big data. Il ne faut pas aller plus vite que la musique. À quoi servent les enseignements tirés des big data si vous ne savez pas les relier à des données client qualitatives ?

* * * *

Rein Mertens est Directeur des solutions métier chez SAS Pays-Bas depuis 1995. Il conseille les clients et prospects sur la façon dont les Business Analytics peuvent aider à résoudre des problèmes métier complexes et à découvrir les opportunités offertes par leurs données. Il dirige une équipe de consultants et de spécialistes travaillant sur la gestion et la visualisation des données, les rapports et l’analyse avancée. Rein participe à de nombreux événements d’utilisateurs SAS, et contribue à des groupes de travail internationaux pour contribuer par ses idées à prioriser les évolutions des produits SAS.

Retrouvez Rein sur Twitter @ReinM ou LinkedIn.

* * * *

En complément :

Un article sur les dispositions de la nouvelle réglementation européenne sur la protection des données (General Data Protection Regulation),

et un autre sur les incidences de cette réglementation sur la gouvernance des données en entreprise.