L’ontologie est surfaite

Reprise d’un article publié par Internet actu
Dans : Brèves , Usages , Web sémantique - Par Hubert Guillaud le 20/03/2006

(magazine en ligne sous licence Creative Commons)

Christophe Ducamp a la bonne idée de traduire ce remarquable article de Clay Shirky, qui date du printemps 2005, intitulé “L’ontologie est surfaite : catégorie, liens et tags”, qui évoque la “révolution” de la catégorisation. Clay explique, avec brio, que nous passons d’un classement par catégories conçu par des experts à un classement par balises (tags) conçu par les utilisateurs... et que ce changement est irréversible. “Il existe une analogie ici avec tout journaliste qui a regardé le web et dit “Et bien, ce truc a besoin d’un éditeur.” Le Web a un éditeur, c’est tout le monde. Dans un monde où la publication est chère, l’acte de publier est aussi un gage de qualité - le filtre venant avant la publication. Dans un monde où l ! a publication est bon marché, en sortir quelque chose ne dit rien de sa qualité. C’est ce qui arrive après qu’il ait été publié qui importe. Si les personnes ne pointent pas, d’autres personnes ne le liront pas. Mais l’idée que le filtrage arrive après la publication est une notion incroyablement étrangère aux journalistes.”

Parmis les nombreux exemples qu’il utilise, Clay souligne le potentiel de Del.icio.us :

"Voici les tags [de l’utilisation d’un compte Del.icio.us] d’un utilisateur unique. A partir de cela, vous pouvez dire quelque chose sur cette personne - il ou elle est évidemment un programmeur Flash - le tag le plus commun est Flash, suivi de nombreux tags en rapport avec la programmation. Comme une page d’accueil, cette distribution a sa signature organique. Les experts ne cataloguent pas de cette façon ; les experts qui apprennent comment cataloguer produisent un étiquetage plus cohérent. Ici, c’est tout ce qu’a pensé l’utilisateur qui l’aidera à se souvenir plus tard du lien. [...]

Puis il y a cette série de graphes. C’est pour moi dans un sens, ce qu’il y a de plus intéressant et le moins bien compris de la part de del.icio.us à cette heure - ce sont deux URLs différentes et les tags qu’un groupe entier d’utilisateurs leur ont appliqués. Le graphe en bas à gauche renvoie à un site pour télécharger des vieilles versions de programmes qui ne sont plus supportées. Vous pouvez voir ici qu’il existe un consensus commun large : 140 personnes ont tagué cette URL “Software”. Puis, le tag suivant le plus commun, avec seulement 20 occurences, est “Old”, puis “Download” et ainsi de suite. Pour cette URL, il existe un consensus clé - ce lien parle de logiciel - et après tout c’est un peu un sens commun, mais il y a une popularité décroissante très pointue dans les tags. [...]

En regardant ce type de données, nous pouvons commencer à dire, des URLs spécifiques, que les utilisateurs taguant cette URL se sont ou non centrés autour de certains tags clés, avec ce degré de certitude et grâce aux chronodatages, nous pouvons même commencer à comprendre comment la distribution des tags d’URLs change au fil du temps. Il s’est passé 5 ans entre la diffusion du lien et la compréhension par Google de comment utiliser l’ensemble général des liens pour créer de la valeur ajoutée. Nous sommes au début de l’utilisation des tags, aussi nous n’avons pas encore de grands ensembles de données ayant vécu suffisamment longtemps, mais ils se constituent rapidement, et nous commençons juste à comprendre comment extraire de la nouvelle valeur à partir de ces collections générales de tags. [...]

“Beaucoup d’utilisateurs taguant les choses foobar sont aussi en train de les taguer frobnitz. Je dirai à l’utilisateur que foobar et frobnitz sont en rapport.” Il dépend de l’utilisateur de décider si oui ou non cette recommandation-là est utile - del.icio.us n’a pas d’idée sur ce que signfient les tags. Le chevauchement de tags est dans le système, mais les sémantiques de tags sont dans les utilisateurs. Ce n’est pas une façon d’injecter un sens linguistique dans la machine. [...]

Tout dépend du contexte humain. C’est ce que nous allons commencer à voir avec del.icio.us, avec Flickr, avec les systèmes qui permettent et agrègent les tags. L’avantage de ces systèmes est qu’ils ne recréent pas la catégorisation structurée, hiérarchique si souvent imposée à nous par nos systèmes physiques. Au lieu de cela, nous traitons avec une ruputure significative - en laissant les utilisateurs taguer les URLs et puis agréger ces tags, nous allons pouvoir construire des systèmes alternatifs d’organisation, des systèmes qui comme le Web lui-même, font un meilleur travail pour laisser les individus créer de la valeur pour un autre, souvent sans en avoir conscience.”

Une traduction que je vous invite à lire, si vous aviez raté l’original et si vous vous intéressez à ce qu’on trouve dans l’Entrenet.

Lien permanent et réaction en ligne

Posté le 2 avril 2006

©© a-brest, article sous licence creative common info

Nouveau commentaire

Animacoop : inscriptions ouvertes pour les sessions 2026 à Brest