Google, les données sociales et la Caverne des Habitus

Au mois de mai dernier, une vidéo interne a fuité de chez Google et causé un certain émoi dans la presse et sur la Toile. Intitulée « The Selfish Ledger » (Le Registre égoïste), elle a été produite en 2016 par Nick Foster, le responsable du laboratoire de recherche et développement de Google. Je n’avais pas eu le temps lors de sa révélation d’en faire un commentaire, mais il se trouve qu’avec le recul, cette vidéo m’a permis de mieux comprendre en quoi les données dites « personnelles » possèdent une dimension collective et il me paraît intéressant de prendre le temps de l’expliquer.

Cela fait plusieurs années à présent que j’essaie de montrer que les données « personnelles » possèdent en réalité une dimension collective, encore largement ignorée par le droit issu de la tradition personnaliste et individualiste initiée par la loi Informatique et Libertés de 1978. Jusqu’à présent, la manière d’exprimer cette idée a consisté à faire remarquer que les données personnelles n’ont pas seulement le pouvoir d’identifier un individu isolé, mais qu’elles sont aussi l’expression de nos liens sociaux. La vie privée étant toujours enchâssée dans une vie sociale, les données ont aussi toujours une dimension sociale, relatives à nos attaches amoureuses, amicales, familiales, professionnelles, etc. Cette dimension collective des données s’inscrit dans ce que l’on appelle le « graphe social » qui forme la trame de nos relations et que les plateformes numériques, type Facebook ou Twitter, s’efforcent de capter afin de l’exploiter économiquement.

Une représentation du « graphe social ».

Le problème de cette approche, c’est qu’elle fonctionne pour des acteurs de type « réseaux sociaux » s’appuyant sur ce « réseau des données liées », mais elle rend beaucoup moins bien compte de la manière dont des entreprises comme Google exploitent les données personnelles. Ce n’est pas tant le « graphe social » que Google cherche à capter qu’à faire un profilage des individus destiné ensuite à être monétisé par le biais de la publicité. Comment se manifeste la dimension collective des données pour ce type d’acteurs ? C’est précisément ce que la vidéo « The Selfish Ledger » permet à mon sens de comprendre.

Évidemment, il ne s’agit pas de prendre ce qui est dit dans cette vidéo pour argent comptant, car il s’agit d’un exercice spéculatif de « Design Fiction » par lequel les équipes de prospective de Google poussent des concepts jusque dans leurs ultimes ramifications. Il ne faut pas en déduire que la vidéo présenterait un plan que la firme de Mountain View chercherait à mettre à exécution à la lettre. Néanmoins elle contient certains concepts intéressants qu’il serait dommage de négliger.

Voici comment le site Business Insider résume le propos de cette vidéo :

En s’appuyant sur les théories de l’évolution et en se référant directement au livre de Richard Dawkins de 1976 « The Selfish Gene », la prémisse de base imagine que les gens ont un enregistrement de données en ligne en constante évolution, ce que Foster appelle le « registre égoïste », le « Selfish Ledger ». A l’avenir, il dit qu’il pourrait être utilisé pour « non seulement suivre notre comportement, mais aussi donner des indications pour aller vers un résultat désiré ».

Bien qu’elles aient focalisé l’attention des médias, ces références à la génétique (et même plus précisément à ce que l’on appelle l’épigénétique) ne m’intéressent pas tellement, surtout qu’elles ne jouent au final qu’un rôle assez « métaphorique » dans la démonstration. Beaucoup plus intéressant par contre est le renversement de perspective exploré par Nick Foster qui imagine en quelque sorte que ce ne sont pas les individus qui produisent les données personnelles, mais les données personnelles qui produisent les individus.

Pour comprendre ce qu’il veut dire, il faut citer les mots du narrateur de la vidéo (voir ici la transcription complète) :

Lorsque nous utilisons les technologies contemporaines, un flux d’informations est créé sous la forme de données. Une fois analysé, il décrit nos actions, nos décisions, nos préférences, nos mouvements et nos relations. Cette version codifiée de qui nous sommes devient de plus en plus complexe, évolutive, changeante et déformante en fonction de nos actions.
A cet égard, ce « registre » de nos données peut être considéré comme un épigénome lamarckien : une représentation en constante évolution de qui nous sommes.

[…]

Les principes de conception centrés sur l’utilisateur ont dominé le monde de l’informatique depuis des décennies, mais que se passerait-il si nous examinions ces choses un peu différemment ? Et si le registre pouvait se voir confier une volonté ou un objectif, au lieu de se contenter d’agir comme une référence historique ? Et si nous nous concentrions sur la création d’un registre plus riche, en introduisant d’autres sources d’information ? Et si nous ne nous considérions plus comme les propriétaires de cette information, mais comme les conservateurs, les porteurs temporaires, les gardiens ?

Une des représentations du fameux « Registre de données » dont parle la vidéo, qui aurait la capacité de passer d’individu en individu au fil des générations.

Nick Foster nous explique que l’usage des outils numériques produit un enregistrement de données (le Registre) rendant compte de chacune de nos actions et il le compare à un épigénome, c’est-à-dire un patrimoine génétique susceptible d’être modifié par le comportement d’un individu au cours de sa vie et transmis à sa descendance (perspective qui est celle de la théorie « transformiste » de l’évolution selon Lamarck, infirmée plus tard par Darwin).

Cela relève à mon sens d’une comparaison assez obscure, mais il est possible d’éclairer plus exactement la nature de ce « Registre » en se référant au concept d’habitus tel qu’il a été forgé par le sociologue Pierre Bourdieu et dont voici une définition :

L’habitus correspond au fait de se socialiser au sein d’un […] groupe, formant ainsi un « système de dispositions réglées » acquises par ajustement spontané entre les contraintes imposées à l’individu et ses espérances ou aspirations propres. L’habitus permet d’expliquer que des individus, appartenant à une même catégorie sociale, à un même groupe, placés dans des conditions analogues aient une vision du monde, des idées, des comportements, des goûts similaires.

Les données figurant dans le « Registre » dont parle la vidéo sont le résultat de nos actions et interactions, mais ce que Foster sous-entend, c’est que Google est capable d’en déduire les causes qui déterminent les individus à agir dans un sens ou dans un autre. On peut utiliser la célèbre allégorie de la Caverne de Platon pour mieux faire comprendre de quoi il s’agit. Nous avons l’impression de « produire » nos données personnelles, alors que nos actes qui les engendrent sont en réalité surdéterminés par notre habitus. En cela, nous sommes comme les humains que Platon imagine enfermés dans la Caverne qui voient s’agiter des ombres sur la paroi devant eux. Nous ne comprenons pas que ces ombres sont produites par des formes passant devant une lumière située derrière nous. La situation est exactement la même pour les données personnelles : nous les voyons comme le résultat de nos décisions conscientes, alors qu’elles sont en réalité le produit du social tel qu’il a inscrit sa marque en nous et s’exprime à travers nous.

Allégorie de la Caverne de Platon.

A travers le « Registre » des données que Google accumule sur chacun de nous, la firme est en mesure de faire ce qui est hors de notre portée : se retourner et « voir » littéralement les habitus déterminant les individus. C’est précisément ce qu’elle fait avec le profilage et grâce auquel elle range les individus dans des catégories permettant – dans une certaine mesure – de prédire nos comportements. Ces catégories constituent une façon pour Google de cerner les habitus conditionnant les individus. Voilà pourquoi les données dites « personnelles » sont en réalité toujours intrinsèquement des données sociales : ce ne sont pas les individus qui les « produisent », étant donné que leur production résulte de mécanismes collectifs, puisque les habitus sont rattachés aux groupes sociaux auxquels les individus appartiennent.

Évidemment, le déterminisme social qu’exprime la notion d’habitus n’a pas une portée absolue et il existe toujours une certaine marge de manœuvre que les individus peuvent mobiliser pour se comporter d’une manière décalée par rapport aux attentes sociales qui pèsent sur eux, sachant aussi que l’habitus peut évoluer dans le temps au fil des milieux sociaux que l’individu va traverser au cours de son existence. Mais ces variations s’inscrivent en permanence dans le « Registre » des données captées par Google et la firme est en mesure, par le biais des opérations de profilage effectuées constamment, de reconstituer en temps réel la configuration de l’habitus d’un individu à un instant T.

Dans la suite de la vidéo, Foster émet l’idée que Google pourrait aussi « reprogrammer » le Registre pour inciter les individus à adopter des comportements conformes aux « valeurs » de la firme. Cela se manifesterait par des incitations envoyées sous forme de notifications par les applications de Google à ses utilisateurs pour réorienter leurs choix. Cela signifie que Google en plus de « voir » les habitus serait en mesure d’agir sur eux et de les modifier selon ses propres besoins. C’est sans doute le point le moins crédible de la vidéo, car Bourdieu montrait bien que si les habitus peuvent évoluer au fil du temps, il est extrêmement difficile pour un individu d’échapper aux déterminations résultant de sa socialisation primaire (celle reçue pendant l’enfance à travers le milieu familial) et que s’il existe une certaine marge d’évolution des habitus, ceux-ci manifestent une forte résistance au changement (notion d’hystérésis de l’habitus). Difficile de penser que de simples « nudges » puissent suffire pour reprogrammer en profondeur un habitus, mais c’est le genre de fantasme qu’il doit être flatteur de faire caresser à des firmes comme Google…

La vidéo « The Selfish Ledger » est donc au fond moins « lamarckienne » que « bourdieusienne » et plutôt que d’emprunter ce détour par la génétique, c’est vers la sociologie qu’il faut se tourner pour comprendre comment fonctionne le « Registre » qu’elle décrit. Cela se manifeste aussi à la fin de la vidéo, lorsque Foster envisage que le « Registre » puisse avoir une dimension transgénérationnelle :

Les données de l’utilisateur ont la capacité de survivre au-delà des limites de son être biologique, de la même manière que le code génétique est libéré et propagé dans la nature.
En considérant ces données avec une perspective lamarckienne, les expériences enregistrées dans le Registre deviennent une accumulation de connaissances comportementales tout au long de la vie d’un individu.
En considérant les données de l’utilisateur comme multi-générationnelles, il devient possible pour les nouveaux utilisateurs émergents de bénéficier des comportements et des décisions des générations précédentes.

Lorsque de nouveaux utilisateurs entrent dans un écosystème, ils commencent à créer leur propre flux de données. En comparant ce Registre émergent à la masse des données historiques des utilisateurs, il devient possible de faire des prédictions de plus en plus précises sur les décisions et les comportements futurs.

À mesure que les cycles de collecte et de comparaison s’étendent, il devient possible de développer une compréhension au niveau de l’espèce de problèmes complexes tels que la dépression, la santé et la pauvreté.

Là encore, la métaphore de la génétique obscurcit à mon sens ce que le recours à la notion d’habitus permettrait au contraire d’éclairer. En effet, avec des ouvrages comme « Les Héritiers », « La Reproduction » ou « La Distinction », Bourdieu a bien montré les mécanismes sociaux qui donnent à l’habitus une portée intergénérationnelle. C’est le milieu social dans lequel les individus naissent et passent leur enfance qui configure initialement leur habitus et lui donne une forme qu’il sera difficile de faire évoluer par la suite. Cet habitus primaire n’est pas uniquement déterminé par la cellule familiale, car il s’agit aussi selon Bourdieu d’un « habitus de classe ». Les classes sociales tendent ainsi à se reproduire au fil des générations par le biais des habitus qui sont « légués » par les parents à leurs enfants.

Une caractérisation des « habitus de classes » selon Bourdieu.

Du point de vue des données « personnelles », ces phénomènes sont aussi tout à fait perceptibles. Car de la même manière que nous naissons porteur des gènes de nos parents, nous obtenons dès notre naissance un certain nombre de données à caractère personnel qui nous « localisent » dans le champ social : par notre nom, notre adresse, notre pays d’origine, notre sexe, etc. Ces données personnelles (qui sont en réalité des « coordonnées sociales ») figurent dès notre premier jour dans le Registre et elles forment la base à partir de laquelle un acteur comme Google pourra identifier notre habitus, jusqu’à ce que la production de nouvelles données au fil de notre vie lui permette d’ajuster ses observations à son évolution.

***

Si l’on prend bien le soin de mettre de côté ses délires eugénistes, la vidéo « The Selfish Ledger » contient à mon sens des éléments importants pour mieux cerner la dimension collective des données personnelles, qui sont donc bien toujours intrinsèquement des données « sociales ». Ce n’est même qu’une illusion d’optique, comme celle dont sont victimes les hommes de la Caverne de Platon, qui nous les fait voir comme « personnelles ». Comme dit Spinoza, « les hommes se croient libres parce qu’ils sont conscients de leurs désirs, mais ignorants des causes qui les déterminent« . De la même manière, nous croyons produire des données « personnelles », uniquement parce que nous sommes ignorants des causes qui les déterminent. Et il est plus juste de dire que ce sont en réalité ces données qui nous déterminent, ou plus exactement, l’habitus qu’un acteur comme Google est capable de « déduire » des enregistrements de données dont il dispose sur nous.

Ma conviction est qu’aucune protection réellement efficace de nos droits ne pourra advenir tant que le législateur ne se sera pas lui aussi retourné dans la Caverne pour voir et consacrer juridiquement cette dimension collective des données, tandis que la réglementation actuelle (y compris le RGPD), prisonnière du paradigme individualiste, est condamnée à ne saisir que des ombres…

Via un article de calimaq, publié le 29 juin 2018

©© a-brest, article sous licence creative common info