Les données de qualité sont des produits fragiles

La qualité des données d’une entreprise évolue au fil du temps. Pas toujours bien. Duplications de bases, intégration de nouveaux jeux de données, créations intempestives d’entrées mettent en cause la fiabilité des résultats… L’adoption de quelques bonnes pratiques permet d’éviter que les données ne soient périmées au moment où elles doivent être utilisées.

La pertinence de l’analyse de données dépend de la qualité des données exploitées. Trop souvent, cette qualité n’est pas contrôlée et, peu à peu, les données commencent à se corrompre, à « sentir mauvais », selon les termes utilisés dans l’article de Sloan review. Les raisons de leur altération varient. Utilisé par différentes entités de l’entreprise, un jeu de données finit par exister sous des formes divergentes. Le volume comme la complexité des données augmentent de façon incontrôlée.

Les conséquences ont un impact non négligeable sur les analyses : incohérence des résultats d’un département à l’autre, duplication de données non actualisées, création de jeux de données qui existent déjà ailleurs dans l’entreprise, etc. Ces problèmes entachent les analyses et leurs résultats de façon critique pour les activités. Parfois, il peut même être impossible de remonter aux données originelles.

Le remaniement des données, souvent perçu comme une perte de temps risquée, coûteuse et non productive, est pourtant nécessaire. Différents processus redonnent de la transparence aux données comme, par exemple, définir une terminologie et des conventions communes, ou procéder de manière itérative. Surtout, au-delà de la technologie, il faut étendre le remaniement aux collaborateurs et à la culture d’entreprise !

Lire l’article (en anglais)

En complément :

Un article (en anglais) sur la nécessité de la gouvernance des données et

un autre (en anglais) chiffrant la perte de revenus des entreprises liée au manque de qualité des données à 12% du chiffre d’affaires d’une entreprise, voire à 50% du budget informatique.

A lire sur Business-Analytics-info.fr :

« L’intégration des données évolue grâce aux big data et à l’open source »

« La qualité des données comme vecteur de compétitivité »