Point de vue

Big Data et Data management: Back to basics

mar. 22 août 2017

Le Big Data, la grande majorité des entreprises s’y est mise. Elles se sont dotées des technologies nécessaires pour pouvoir collecter en temps réel des flux de données colossaux. Cependant, ce n’est plus là que se trouve la compétition. Le match se joue désormais sur la capacité des entreprises à exploiter et valoriser les données collectées. La question de la qualité des données est devenue centrale et évidente. La mise en pratique quant à elle reste encore bien trop aléatoire et peu satisfaisante…

Ce n’est pas parce que c’est possible qu’il faut le faire !

 

Le Big Data permet de collecter toutes sortes de données. Sont-elles toutes vraiment utiles ? Non !

Avant de se mettre à collecter de l’information à tout va, il faut caractériser ce dont on a besoin.

Si je vais au supermarché sans ma liste de course je risque de me laisser tenter par tout un tas de produits. De retour à la maison, même si mes placards sont pleins je n’aurai pas répondu à mon besoin. Une entreprise dotée de technologie Big Bata est comme une personne sans liste de course. Avant de se lancer dans l’aventure, il est donc crucial de déterminer une stratégie Big Data et d’identifier le besoin.

De cette façon, on peut d’une part qualifier les données et d’autre part éviter l’écueil de la collecte de données intempestives qui viennent remplir nos espaces de stockage pourtant si précieux.

 

 

 

La qualité avant la quantité

 

Une fois le besoin identifié, il faut savoir mettre en place les outils et les méthodes pour récolter des données de qualité. Saviez-vous qu’un quart des données récoltées par les entreprises sont inexactes[1] ? Prenons l’exemple d’une entreprise qui cherche à mesurer sa côte de popularité sur les réseaux sociaux. Si je suis l’entreprise Mars (et ses fameuses barres chocolatées) par exemple, lorsque je souhaite étudier les publications se référant à ma marque, je dois faire attention à ne pas prendre en compte la multitude de publications parlant de Bruno Mars, chanteur américain. N’oublions pas que l’exploitation des données constitue aujourd’hui un socle d’information sur lequel se basent de plus en plus les décisions opérationnelles et stratégiques des entreprises. Les décideurs doivent pouvoir s’y fier. Mieux vaut donc privilégier la qualité des données à la quantité.

La qualité de la donnée passe aussi par son traitement. Pour éviter les redondances, il est important de la standardiser. Produits, services ou localisations peuvent avoir plusieurs dénominations possibles. La ville de Paris par exemple a bien des surnoms, « la ville lumière » ou encore « Paname » n’en sont que deux exemples. Pour autant, traités séparément, les résultats de l’analyse pourraient en être faussés.

 

[1] The state of data quality, Experian Information Solutions, Inc.

 

 

Centraliser et partager les données !

 

Plus de 50% des salariés estiment avoir un accès limité à l’information dont ils ont besoin pour prendre les bonnes décisions. Ce n’est pas le tout que de savoir collecter la bonne donnée, encore faut-il savoir la partager de manière transversale. Il est donc important, en interne, non seulement de regrouper des informations mais également de le faire de manière uniforme et automatique afin d’obtenir des résultats justes. Les données doivent être centralisées et homogènes afin d’éviter la remontée d’informations contradictoires, les données obsolètes ou en doublon.

L’actualisation constante d’un inventaire interne et commun regroupant toutes les données offre cette garantie. Elle sert de référence pour limiter les interprétations.

 

 

Organiser le cycle de vie des données

 

Enfin, les données ne sont pas immuables, une information valable aujourd’hui ne l’est pas forcément demain.

Il faut donc savoir gérer le cycle de vie des données. Peu d’entreprises adoptent une stratégie pour les réviser, les archiver et les supprimer. Cette gestion est pourtant indispensable pour garder une base de données saine et pérenne. La révision régulière des données permet d’en garantir la pertinence, de les requalifier ou de les mettre à jour. Ceci évite de stocker des informations obsolètes ou erronées. Le choix entre archivage ou effacement est propre à l’entreprise. La suppression doit être bien pensée afin d’éviter de perdre des données sensibles soit parce qu’elles sont soumises à des réglementations soit pour préserver la sécurité des données.

 

 

Ces « basics » permettent à l’entreprise de regagner le contrôle de l’information. Une stratégie de management des données lui donne un regain de visibilité favorisant la valorisation et la protection des données mais également les prises de décisions. La maitrise des données est un prérequis pour que le Big Data puisse tenir ses promesses et délivrer les insights clients nécessaires pour comprendre et anticiper leurs besoins et améliorer l’expérience client.

 

Lisa Boumard

L’article Big Data et Data management: Back to basics est apparu en premier sur Sofrecom.