Demain, l’intelligence des données

Quand on regarde l’avenir, on a souvent tendance à penser que le changement le plus radical reposera surl’internet des objets, une intelligence qui va bouleverser notre relation avec eux et leurs relations entre eux. Bien sûr, parce qu’on va les tenir dans nos mains, parce qu’ils vont bouger sous nos yeux, ces changements-là seront spectaculaires.

Reprise d’un article publié par Internet actu
Dans : Web sémantique, Enjeux, débats, prospective, Opinions - Par Hubert Guillaud le 7/09/2007

(magazine en ligne sous licence Creative Commons)

Pourtant, demain, il n’y a pas que les objets qui seront intelligents : il y aura aussi les données. Et l’impact de ce changement pourrait bien être tout aussi radical.

Voilà longtemps que Tim Berners-Lee nous explique que le web sémantique est l’avenir du web (voir la traduction de l’article originale dans la lettre de l’URfist de Toulouse de novembre 2001 .pdf). Reste que le terme est difficile à faire comprendre et entendre à bien des néophytes. Sans compter que l’évolution qui se profile dans le domaine des données ne repose pas seulement sur la sémantisation du web et ne se résume pas à inscrire des méta-données pour décrire les données.

L’intelligence des données (au sens, plutôt, que l’on donne à “intelligence économique”), c’est d’abord leur abondance et leur accessibilité, même si chaque donnée demeure elle-même tout à fait brute. C’est par exemple accéder aux données de tel capteur, de telle caméra ou de tel moniteur. C’est la possibilité, demain de tracer n’importe quel évènement du monde réel. C’est la fouille de données accessible depuis chez soi, permettant d’analyser les statistiques de la criminalité ou de la circulation dans sa ville, ou des informations sur ce que lisent les gens, avec un raffinement de détails, des modalités de recherche et de précision dans la requête toujours plus grands.

Ce n’est donc pas seulement la sémantisation qui change la donne, mais aussi l’accès à un nombre croissant de données, associé à la possibilité de les reconfigurer, de les recombiner sans cesse,de plus en plus facilement, pour en tirer des intuitions neuves ; la possibilité d’en faire des mashups, de produire des nouveaux services dont elles forment la matière première… Quand les données elles-mêmes ne sont pas “intelligentes”, leur masse, bien exploitée, peut produire du sens bien au-delà de ce que nous imaginons, comme l’explique Ian Ayres. Pas seulement des masses d’information statiques et statistiques d’ailleurs, mais des données qui vont être de plus en plus dynamiques, parce qu’elles seront accessibles à distance et en temps réel bien sûr, mais surtout parce que ces données mêmes seront le résultat de flux de données eux-mêmes mouvants. De combinatoires. De formules appelant d’autres données, provenant de bases sémantisées, de nos historiques de navigation, ou de requêtes sur des applications tierces.

Comme l’imageait Bradley Horowitz, responsable du département des nouvelles technologies chez Yahoo, en évoquant l’avenir de l’internet des objetspour la BBC : “Mon téléphone sait toujours l’heure qu’il est. Il sait approximativement toujours où je suis via GPS ou via le réseau téléphonique qu’il utilise. Si le système sait aussi que je suis présent à tel évènement à telle heure (via mon agenda ou mes messages), alors quand je prends une photo, le système est capable d’automatiser l’étiquetage de cet évènement et d’introduire les métadonnées automatiquement. C’est ce vers quoi nous tendons : un monde où le qui, quoi, où et quand peuvent être générés, lus et résolus automatiquement par les machines.”

Le croisement des données elles-mêmes, au lieu et à l’heure où elles sont collectées ou regroupées va en générer de nouvelles.

L’intelligence des données, ce n’est pas que le web sémantique, c’est aussile web implicite, celui qui comprend ce que vous faites, ce que vous avez fait et en déduit ce que vous allez faire. C’est celui qui trace vos données, votre histoire, qui suit votre “parcours”, votre “chemin” pour apprendre de vous et mieux vous servir et qui se diffuse demain au-delà du web, jusqu’à nos mobiles.

L’intelligence des données c’est enfin ce web que nous façonnons à coups de liens, d’étiquettes, d’intelligence collective : “Chaque fois que nous forgeons un lien entre les mots, nous lui enseignons une idée”, disait Kevin Kelly. C’est ce web qui apprend de nous. Ces données qui prennent du sens quand on les touche. Nos actions qui deviennent une donnée primordiale pour donner de l’intelligence à l’ensemble. Un web sémantique a posteriori, en quelque sorte, qui repose sur le constat qu’il semble parfois plus difficile de rendre les données “intelligentes” en les qualifiant a priori, que d’acquérir une “intelligence”, une perception et une compréhension riches, des données brutes que notre monde produit à jet continu.

Assurément, l’intelligence des données va transformer notre rapport à l’information aussi sûrement que l’internet des objets va bouleverser notre rapport à notre quotidien (l’un n’ira pas sans l’autre d’ailleurs).

Nous allons mesurer le monde, notre vie, notre entourage, notre réseau comme jamais. Tout sera traçable et tracé, comme le montre d’une manière ludique Socialistics, cette petite application pour Facebook qui mesure les pulsations de votre réseau social. Un outil de lifelogging (ces outils qui augmentent notre intimité d’informations) qui rassemble toutes les données de votre réseau relationnel pour produire des mesures vous permettant d’en connaître les tendances (répartition par âge, par ville ou pays, par genre, par tendances politiques ou religieuses…). Cet outils de classement et d’analyse illustre à merveille la puissance de l’information que l’on pourrait être capable de produire demain. Cela ne va pas seulement nous donner accès à une “nouvelle classe d’outils”, comme l’évoquait Tim Berners Lee, mais radicalement changer nos pratiques, notre regard sur celles-ci et sur tout ce que nous faisons et nous entoure.

Reste qu’il ne faut pas oublier que les données ne sont pas intelligentes pour elle-mêmes. Leur couplage peut aussi produire des syllogismes faciles et des erreurs d’interprétation : coupler une base de donnée statistique sur la criminalité et une autre sur la pauvreté de la population fera peut-être ressortir l’image fameuse des “Classes laborieuses, classes dangereuses”. Cela n’en fait pas forcément une vérité, disait déjà l’historien Louis Chevalier. Et puis, on n’est pas obligé d’aimer la perspective d’un monde infiniment lisible, traçable et analysable. Ca ne doit pas nous empêcher d’y réfléchir.

Hubert Guillaud