De la donnée au big data

De la donnée, de la data, on en a toujours produit : du  petit ticket à la caisse de la superette jusqu’à la réservation d’avion, c’était déjà de la data, des données. Qui, certes, n’étaient alors pas enregistrées ni encodées dans un ordinateur ou une base de données informatique… mais c’étaient déjà des données.

 

Ensuite, vint la carte de fidélité, là, évidemment, comme pour l’abonnement au sport ou le livre emprunté à la bibliothèque, il a fallu mettre en place des registres. Certains utilisent d’ailleurs encore le système de la bonne vieille boîte à chaussures remplies de fiches bristol. Mais,  registre rimant avec enregistre, l’ordinateur a fait son apparition pour gérer d’abord les cordonnées dans une base de données indexée par ordre alphabétique, voire même cartes perforées stockées dans une armoire. On était encore bien loin de la big data.


  • Pour rappel, le premier TRS 80 a été introduit sur le marché en 1977.


Mais, bardaf, voici internet avec ses liaisons (parfois dangereuses) qui vient permettre non seulement de partager des données, mais, surtout, de les échanger entre ordinateurs et d’agréger des données venues de différents horizons. Et là, la donnée revêt une autre dimension.


  • Pour rappel , en 1989, CompuServe est la première société à fournir un accès (limité) à Internet en connectant son système propriétaire de messagerie électronique au World Wide Web (WWW). Au début des années 1990, les services de CompuServe sont très populaires et comptent des centaines de milliers d’utilisateurs à travers le monde qui visitent ses milliers de forums modérés, versions grand public des forums usenet alors essentiellement utilisés par les universitaires et les industriels.

     


En effet, la donnée simple n’a pas de valeur. Ex. Vous êtes une femme ou vous faite du sport. Par contre, si on peut croiser ces données pour dire que vous êtes une femme qui pratique du sport, et bien, cette information commence à avoir de la valeur pour les annonceurs. Ceux-ci vont pouvoir – lorsque vous vous connectez de façon identifiable-  vous “poussez” des promotions, des messages publicitaires personnalisés.

 

Suite logique : les réseaux sociaux ou, par définition, vous devez établir un profil, si possible complet. Et quand bien même le laisseriez-vous  bien lacunaire, c’est alors l’usage du réseau qui va permettre de vous profiler. Alors imaginez si votre profil est complet, et encore précisé par vos likes aux commentaires, photographies, échanges, publications, pages appréciées… etc.

 

Pour compléter votre profilage, ajoutons votre smartphone, lui, il est là pour profiler votre mobilité, les lieux que vous visitez le plus fréquemment, la vitesse à laquelle vous vous déplacez, le nombre de fois que vous partez à l’étranger… Les endroits que vous préférez sont, par exemple, probablement ceux d’où vous postez le plus souvent des photographies. Vos restaurants préférés sont probablement ceux qui font l’objet de vos mentions…

Alors, évidemment, tous ces éléments ne sont pas examinés à la loupe par une personne qui ferait des recoupements ou regroupements un à un. Ces données sont analysées, moulinées par des algorithmes. Non pas sur une, mais sur ces milliers ou des centaines de milliers de personnes. On parle alors de Big Data.