La qualité des Big Data, c’est le problème de la DSI, pas le mien. Vraiment ?

Comment développer la qualité des données Big Data ?

Considérée comme l’un des principaux défis à relever par les entreprises en 2013, la gestion et l’exploitation des Big Data ne peut être envisagée sans avoir au préalable réalisé un travail de nettoyage et d’enrichissement des données. Un processus qui ne relève pas seulement de la DSI, comme on aurait tendance à le penser, mais aussi et surtout d’un changement de culture d’entreprise plus orienté business et métiers.

Comment développer la qualité des données Big Data ?

Comment développer la qualité des données Big Data ?

Le Big Data s’impose comme le grand sujet d’actualité sur les marchés TIC en 2013. Le cabinet Gartner a estimé ce marché à 28 milliards de dollars (22 milliards d’euros) pour 2012 et 36 milliards pour 2013. La gestion des données s’est fortement complexifiée au cours des 2 dernières années. L’explosion des volumes de données a eu lieu de manière concomitante avec l’utilisation massive des réseaux sociaux et a généré deux principaux défis : l’analyse et l’exploitation en temps réel des données structurées et non structurées multi formats et multi sources (réseaux sociaux, RFID, GPS, QR codes …), disponibles en très grands volumes (atteignant parfois le pétaoctet) ; mais aussi veiller à la qualité de ces données car une banale erreur peut vite impacter l’activité de l’entreprise. Une entreprise qui ne contrôle pas ses données peut vite voir son image entachée, et perdre la maîtrise de l’un des rouages clés de son activité.

Les dirigeants en sont les premiers convaincus, quel que soit le secteur de leur entreprise. L’étude Strength in Numbers : How Does Data-Driven Decisionmaking Affect Firm Performance ?, menée dès 2011 auprès de 179 entreprises cotées par Erik Brynjolfsson et Heekyung Kim, deux chercheurs du MIT, en partenariat avec Lorin Hitt, chercheur à l’université de Pennsylvanie (Wharton Business School), montrait déjà que les organisations qui s’appuient sur l’analyse des données pour développer leur stratégie augmentent leurs niveaux de productivité de 5 à 6 % .

Qualité des données ?

Or, force est de constater que le préambule à tout projet Big Data qu’est la garantie de la qualité de ces données est souvent peu satisfaisante.  Trois raisons à cela :

  • Beaucoup de données sont encore saisies manuellement, avec un risque élevé d’erreur à la clé.
  • Il est, dans bien des cas, difficile de lier les données les unes avec les autres car elles sont issues de sources très diverses et ont des formats variés difficiles à intégrer entre eux.
  • Enfin les entreprises disposent de peu de compétences en interne sachant évaluer la qualité des données et les analyser pour remonter des indicateurs pertinents aux métiers.
Jean-Blaise Diebold, Directeur Marketing Europe du Sud, Pitney Bowes Software

Jean-Blaise Diebold, Directeur Marketing Europe du Sud, Pitney Bowes Software

Alors comment s’y prendre ? Historiquement, toute personne rencontrant un problème lié aux données était aiguillée vers la DSI. Or il est risqué et réducteur de vouloir résoudre le problème uniquement sous l’angle technologique. La qualité des données concerne en effet d’autres départements de l’entreprise – la DSI ayant même très rarement une vue globale et complète des conséquences d’une mauvaise qualité des données sur les opérations. D’autre part, le rôle de l’humain reste primordial puisque, dans une majorité d’entreprises, les données sont encore saisies ou vérifiées manuellement.

Comment développer la qualité des données ?

La solution est donc ailleurs, à savoir dans la culture même que l’entreprise a de sa gestion des données. Il est important que l’ensemble des équipes la considère comme un atout “business”, ce qui suppose dans bien des cas de faire évoluer les mentalités. A ce titre, le dirigeant lui-même doit assumer la responsabilité des données de son entreprise et de tout problème lié à leur qualité.

Pour soutenir ce changement, l’un des leviers d’amélioration consiste à automatiser le processus de collecte, de nettoyage et d’enrichissement des données. Les entreprises ont à leur disposition des solutions logicielles matures qui permettent de les dédoublonner, standardiser, rassembler etc… La DSI se chargera de piloter le projet mais devra le faire en étroite collaboration avec les métiers concernés – par exemple, pour les données clients, avec les départements marketing et relation clients.

Second levier à activer : impliquer les collaborateurs dans le processus d’amélioration de la qualité des données en insistant sur le fait qu’il n’y aura pas de valeur associée aux big data sans des bases propres. Il faudra aussi former ceux qui les gèrent et/ou les analysent. Enfin, l’entreprise gagnera à désigner une équipe en charge de la gouvernance des données, c’est-à-dire qui gèrera et évaluera en continu l’amélioration de la qualité des données et leur intégration.

Alors que les entreprises cherchent à se doter de nouveaux avantages concurrentiels, jouer sur ces deux leviers leur garantit de meilleures prises de décisions, une diminution des coûts d’exploitation, l’amélioration de la satisfaction client et de meilleures performances financières. D’ailleurs, qui prendrait encore des décisions stratégiques basées sur des données incomplètes, inexactes, incohérentes ou corrompues ? Cette importance critique des données s’est même traduite dans certaines entreprises par l’arrivée de nouveaux intervenants au sein des conseils d’administration : celles du directeur de la gouvernance des données et du directeur marketing. Une évolution à suivre dans les prochains mois et sur laquelle nous aurons l’occasion de revenir bientôt…

Auteur : Jean-Blaise Diebold, Directeur Marketing Europe du Sud, Pitney Bowes Software

Un article de notre dossier Big Data et Marketing

Les avis de nos experts sur le Big data et Marketing…

Le big Data Marketing vu par ceux qui le font ;)

Interviews…

Les articles 2012 sur le Big Data Marketing

 

avatar
L'invité de Marketing Professionnel tient une Tribune Libre. Profil des invités et Tribunes Libres publiées.


Commentez !

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>