Miser sur les “small data” pour innover

La révolution des données concerne aussi le secteur des médias. Pour produire de l’information percutante, les journalistes recourent de plus en plus souvent aux « small data » — un concept mieux adapté que les big data à un traitement humain. Zoom sur une tendance qui donne des résultats probants.

La récente affaire des Panama Papers, dévoilée par une équipe de journalistes récompensée par le Prix Pulitzer, a mis en lumière la puissance des données pour créer des récits percutants. Malgré la disponibilité de plus de 2 téraoctets de données, les enquêteurs n’ont en réalité utilisé qu’une vingtaine de mégaoctets (soit à peine 0,00 000 001 % !) afin de nourrir la chronique de leurs révélations. Ils se sont notamment employés à agréger de multiples informations en petits jeux de données pouvant tenir dans quelques feuilles de calcul d’un tableur. C’est à partir de cette matière première réduite à des « small data » que les journalistes ont pu travailler efficacement.

Pour trouver, croiser et mettre en forme ce type de données, plus aisées à appréhender et à traiter que les big data — réservées aux machines —, les professionnels de l’information disposent d’outils en ligne dédiés, comme data.world, datawrapper ou flourish. Les médias peuvent aussi s’appuyer sur des initiatives citoyennes, par ailleurs sources d’engagement, pour enrichir leur collecte d’informations et obtenir des résultats tangibles. Ainsi, une enquête sur le phénomène des féminicides en Colombie à partir d’une collaboration entre des journalistes et un utilisateur de Twitter a abouti à la constitution d’une base de données exhaustive, ce qui a permis d’interpeller le gouvernement local via la rédaction d’un rapport et de trouver des solutions.

 

Lire l’article 

 

En complément :

Un point de vue sur le datajournalisme, une chance pour la presse,

et un article au sujet des vertus des small data pour l’apprentissage automatique.