Big Data ce n’est SURTOUT pas que de la technologie, mais des données qui doivent fournir à ses utilisateurs plus de compréhension pour prendre les bonnes décisions.
Quand on parle des 4 V du Big Data on se focalise souvent sur les problèmes de volumétrie ou de vitesse, voire de variété des données. Les technologies gèrent assez facilement aujourd’hui ces 3 V, mais qu’en est-il du quatrième ? LA VERACITE.
Si l’on base nos décisions sur des données il faut être sur qu’elles apportent une « vérité » vraie, ou tout du moins utile.
Cette validation de la véracité est cruciale pour ne pas être induit en erreur sans le savoir. Que peut il arriver en fait, quelles sont les erreurs à éviter ?
- La plus banale (mais pas toujours évitée malheureusement) des erreurs est celle d’utiliser des données trop anciennes pour créer des profils comportementaux. Les modèles seront précis sur des comportements qui ne se reproduiront plus… dommage. On a collecté, stocké et analysé des données pour arriver à un résultat faux, quelle perte de temps et de moyens !
- Les plus récentes, je récupère sur tous les points de contacts possibles avec mes clients des données et je les analyse. Sauf que certaines de ces données n’ont aucune valeur pour comprendre ou modéliser par exemple un comportement d’attrition. Peut-être en ont elles pour autre chose…
- Les plus techniques : j’ai collecté des données a priori bonnes et je vais essayer de prédire un comportement. Mais est-ce que toutes ces données sont des variables significatives ? La multiplicité des données ne nous empêche pas de valider la pertinence de celles-ci en temps que variable, il faut même attacher plus d’importance à connaître son intérêt ou non
- La plus sournoise : la donnée est elle juste ou vraie. Puis-je croire en cette information ? L’exemple classique dans le monde bancaire ou des assurances est le client qui se cache sous une autre identité. On pourrait faire une segmentation et le trouver dans un segment de prospects à fort potentiel et se retrouver rapidement avec des défauts de paiement.
- La trompeuse : l’explosion de la collecte des données des réseaux sociaux est le nouveau Graal du marketeur. Mais combien de départements marketing analysent le réseau social et ses relations internes avant d’analyser les discussions ? Un internaute peut être très verbeux au sein d’un groupe (le plus de posts ou de commentaires), faire partie d’un groupe (reach réseau important) mais n’avoir AUCUNE influence sur le comportement des membres du groupe.
Avoir des données à analyser c’est bien, savoir lesquelles sont pertinentes et justes pour baser ses décisions c’est mieux… et d’autant plus important que les données sont le fioul du nouveau marketeur.
Auteur : Hervé Dhélin, Worldwide Marketing Director EfficientIP, Administrateur du CMIT (Club des directeurs marketing et communication de l’IT)
***
(c) ill. Shutterstock – Top of a rusty yellow fuel container