Repenser la fraîcheur des données : temps réel, bon moment et durée de vie

L’analytique « temps réel » est d’actualité du fait de son impact avéré dans la prise de décision, la relation client et la rentabilité de l’entreprise. Pour être juste, il faut reconnaître que la technologie est nouvelle et enthousiasmante, et donc indéniablement attrayante. Une partie de son succès proviendrait du fait que tout le monde peut entrevoir son potentiel, et que le cynisme n’est pas encore de mise. Une tribune de Muhammad Asif Abbasi, Principal Business Solutions Manager chez SAS.

A ce jour, les projets concernent, entre autres, le support de la planification de la demande dans le secteur de la distribution. Ils semblent intéressants et les premiers résultats sont positifs, notamment dans la perspective d’améliorer la gestion des stocks et l’expérience client. Peu d’échecs ont été relatés parmi ces premiers projets. Peut-être parce que peu ont dépassé le statut de maquette et que la difficulté réside souvent dans la mise à l’échelle, ou peut-être parce que personne n’admet l’existence de problèmes. La discussion se concentre toujours sur la façon de tirer profit des investissements – réalisés ou espérés.

 

Du « temps réel » au « bon moment »

 

Toutefois, certains analystes et spécialistes commencent à s’interroger. Ils ne remettent pas en cause le potentiel de l’analytique temps réel, mais se demandent si le temps réel est toujours nécessaire, voire utile. La plupart des connaissances obtenues aujourd’hui proviennent de données stockées à la source et analysées ultérieurement. Ceci s’explique en partie parce que les données de ce type sont plus nombreuses, mais aussi parce que ce délai permet d’en garantir la qualité, via une préparation appropriée des données.

Ainsi, les données peuvent être utilisées au moment le plus opportun. La question n’est pas tellement de savoir si l’analyse de données en temps réel est possible, mais si le temps réel peut correspondre au « bon moment » pour ces données et ces connaissances spécifiques. L’analyse de données doit soutenir la prise de décision. L’analyse au bon moment fournit donc des indications à la bonne personne, dès qu’elles sont nécessaires. Parfois, cette opération est réalisée en temps réel, mais, souvent, ce n’est pas le cas. Dans d’autres cas, une combinaison de données stockées et en temps réel est nécessaire pour générer des informations utiles, par exemple sur l’évolution du comportement des clients au fil du temps.

 

« La question n’est pas tellement de savoir si l’analyse de données en temps réel est possible, mais si le temps réel peut correspondre au « bon moment » pour ces données et ces connaissances spécifiques. »

 

Adopter l’analytique temps réel n’est donc pas toujours la meilleure réponse pour accélérer l’analyse des données et l’obtention de connaissances. On peut plutôt choisir de se concentrer sur l’amélioration des fonctions de préparation et de gestion des données. Cet aspect représente souvent la partie la plus longue et la plus difficile du processus analytique. En d’autres termes, une plate-forme de gestion de données enrichie aide les organisations à améliorer leurs capacités analytiques, car elle favorise une meilleure utilisation des données existantes.

 

Le chaînon manquant

 

Mais – car il y a un « mais » – je pense que cette démarche laisse de côté un point fondamental : les données, comme les aliments, ont une date de péremption. Plus longtemps elles résident dans votre magasin de données, moins elles sont à jour. Et, par conséquent, elles sont potentiellement moins utiles. Dans le secteur de la santé, par exemple, les informations concernant un patient particulier doivent être récentes. Les données de plus d’un an ne seront pas utiles, car l’état de la personne peut s’être considérablement détérioré ou amélioré depuis. Mais les données couvrant le mois ou les six mois précédents, montrant une tendance, sont certainement plus utiles.

 

« Une plate-forme de gestion de données enrichie aide les organisations à améliorer leurs capacités analytiques, car elle favorise une meilleure utilisation des données existantes. »

 

En pratique, passer du temps à essayer de trouver le cas d’usage « parfait » des données, en temps réel ou non, peut se révéler contre-productif. Paraphrasant Nike, on pourrait dire « Just do it » ! C’est-à-dire, commencez à expérimenter avec certaines données, et reconnaissez que l’échec est bon, puisqu’il vous permet de tester d’autres options. Manipuler des modèles, en essayant de les perfectionner, est en réalité le plus mauvais moyen d’obtenir rapidement des informations à partir de données, avant qu’elles n’atteignent leur date de péremption. La perfection est souvent l’ennemie du « suffisamment bon », ce qui est particulièrement vrai avec les données et la modélisation.

 

La valeur de l’immédiateté

 

Il est donc possible que la véritable importance des données temps réel réside dans leur immédiateté. Non pas que vous ayez besoin de prendre des décisions en une fraction de seconde, mais les données doivent être aussi fraîches et actualisées que possible. Elles vous donnent ainsi les dernières informations sur le comportement des clients, la rotation des stocks ou l’historique des transactions. Votre prise de décision sera-t-elle plus précise si vous les analysez immédiatement, en temps réel, ou si vous les nettoyez et les utilisez peu après ? Cette question n’est pas pertinente. Il est surtout essentiel que les données soient à jour et n’aient pas atteint leur date de péremption.

Tout comme votre bouteille de lait, vous devez utiliser vos données avant leur date de péremption. Etre en mesure d’accéder à des données en temps réel soutient ce processus. C’est aussi simple que ça.

 

Muhammad Asif Abbasi, Principal Business Solutions Manager

Asif s’appuie sur plus de 15 ans d’expérience professionnelle. Il est notamment spécialisé dans l’analyse des big data, l’entreposage de données et Hadoop pour plusieurs secteurs d’activité, comme les télécommunications, la production, les finances et les services publics.

Il collabore avec les entreprises pour les aider à tirer le meilleur parti de leurs investissements Hadoop et à utiliser SAS pour alléger la gestion des changements lors de l’adoption de Hadoop.

 

En complément :

Une tribune sur la relation véhicule autonome – analytique temps réel,

et un article de SAS sur l’intérêt ou non du temps réel.