Comment réduire l’utilisation des données ?

Un texte de Jim Harris, expert reconnu dans le domaine de la qualité des données, consultant et auteur indépendant, rédacteur en chef du site « Obsessive-Compulsive Data Quality ».

Il ne fait pas de doute qu’aujourd’hui les organisations collectent, stockent, traitent, gèrent, analysent et gèrent plus de données que jamais auparavant. A l’heure de la Big Data, nous nous sentons obligés de conserver toutes les données parce qu’elle pourraient potentiellement être utiles un jour. Une complication supplémentaire est amenée par toutes les copies de données d’entreprise (en fait des silos de données) customisées pour une application ou une analyse spécifique, ou pour répondre aux besoins d’un projet tactique ou d’une initiative stratégique. Même si ces données personnalisées deviennent souvent obsolètes après la finalisation ou l’abandon du projet ou de l’initiative, elles continuent d’être conservées et maintenues. Les entreprises disposent de nombreux processus de maintenance des données, mais rares sont celles qui minimisent l’utilisation des données en supprimant les données inutilisées ou obsolètes dans le cadre d’une stratégie bien définie de conservation des données.

Comment réduire l’utilisation des données: comptez les moyens

Même parmi les données que vous et votre organisation utilisez activement et régulièrement, il existe d’innombrables possibilités de minimiser votre utilisation des données. Pour les identifier, vous devez tracker de façon stricte votre utilisation des données.

Ces dernières années, il y a eu une explosion des outils de suivi de données ou data tracker permettant de collecter des informations sur notre santé, notre forme physique et nos finances. Nous les utilisons pour compter les calories que nous consommons en mangeant, celles que nous brûlons en faisant de l’exercice et l’argent que nous dépensons en faisant les courses. Sans ces informations, nous ne pourrions pas facilement réduire nos mauvaises habitudes et nos choix de consommation les plus extravagants. Même nos appareils mobiles ont des trackers qui collectent des informations sur les applications que nous utilisons, quand et à quelle fréquence. Cela peut nous aider à éviter la surconsommation de nos forfaits de données mobiles et même identifier les applications ayant tendance à nous rendre moins productifs et moins attentifs (pour moi, ce sont les services de streaming vidéo, les jeux et les e-mails). 

Suivez votre utilisation des données – de façon simple

Il n’est pas nécessaire d’avoir une application mobile dernier cri pour suivre vos habitudes et savoir comment minimiser l’utilisation des données dans l’entreprise. Je vous recommande d’utiliser votre tableur préféré pour enregistrer votre utilisation des données chaque jour, pendant au moins un mois. Restez simple, mais veillez au moins à capturer les informations suivantes dans une colonne :

1 – Nom des données

2 – Brève description des données, de leur source à leur cycle de vie (le « data lineage »)

3 – Objectif commercial / utilisation des données

4 – Quand avez-vous accédé aux données ?

5 – Combien de temps avez-vous passé à utiliser les données?

6 – Tout problème de qualité des données rencontré lors de l’utilisation des données (prenez des notes brèves)

7 – Quantité de données utilisée – si le volume est inférieur au volume complet, décrivez brièvement tout filtrage ou agrégation appliqué

8 – Est-ce que les données étaient nécessaires ou utiles pour effectuer les tâches associées à leur utilisation ?

Vous devrez détailler chaque utilisation individuelle des mêmes données sur une ligne dédiée dans votre feuille de calcul de suivi. En effet, la même source sera probablement utilisée à plusieurs fins et / ou sera accessible plusieurs fois au cours d’une journée ouvrable. Une fois que vous réalisé ce suivi pendant un mois, vous pourriez être surpris des résultats. De nombreuses utilisations de données sont habituelles, redondantes ou superflues – et sont donc facilement éliminées.

Vous pourriez constater :

  • L’utilisation de plusieurs sources pour le même objectif.
  • Une perte de temps liée au nettoyage des données lorsqu’une meilleure source est disponible.
  • L’utilisation de données simplement parce qu’elles ont toujours fait partie de votre processus (même si elles ne font que peu ou rien pour vous aider à faire votre travail).

Que devriez-vous en retenir ?

Que vous et votre organisation utilisez presque certainement trop de données. Le suivi des habitudes de votre entreprise vous montrera comment réduire et optimiser l’utilisation des données en éliminant les consommations de données redondantes, de faible qualité et inutiles. En retour, vous pourriez travailler plus efficacement en utilisant le moins de données possible pour atteindre les objectifs de l’entreprise.

Lire l’article