Les microformats, prochaine étape du web sémantique ?

Reprise d’une brève publiée par Internet actu magazine en ligne sous licence Creative Commons

Dans : Brèves/Usages/Normes et standards/Web sémantique - Par Hubert Guillaud le 12/09/2005

Vous ne connaissez pas les microformats ? Bon. Ca va être un peu technique a expliquer.

Pour Frédéric Cavazza, consultant, le principal intérêt est de "rendre exploitable par des robots du contenu à la base crée pour des humains. Exploitable veut dire qu’à partir d’une requête structurée il est possible de rapatrier des informations précises. Par exemple « va sur le site XX pour parcourir sa liste de liens et me rapatrier tous les sites dont les auteurs se connaissent personnellement ». Ça n’a l’air de rien, mais ce type de requête structurée peut vous éviter d’avoir à investir des milliards de dollars dans un algorithme d’indexation plus performant que celui de Google."

Bien, mais comment cela fonctionne-t-il ? Ecoutons Stéphane Lee qui est très compréhensible pour qui connaît un petit peu le HTML :

Prenons le cas des attributs de blocs

qui définissent une zone dans la page web. Aujourd’hui, la principale raison qui pousse un développeur à ajouter un descriptif du genre
est le fait qu’il pourra traiter la présentation de ce bloc dans une feuille de style CSS. Il pourra en effet décrire la présentation qu’il souhaite donner à ce bloc dans une directive de type div.toto font-size:12px ; .

Le "toto" n’a évidemment aucune signification, sinon pour lui. Si maintenant, au lieu de choisir "toto", il choisit

conformément à un à un micro-format standard. Non seulement il pourra continuer à appliquer des directives de présentations CSS sur son bloc, mais ce bloc pourra également être interprété par des robots ou des protocoles adhérant au micro-format. Son contenu correspondra au titre d’un article de blog, et toute machine pourra le traiter comme tel, pour agréger, mixer, reformater, communiquer, extraire, inclure, etc.

"Il s’agit d’utiliser les capacités qui résident déjà au coeur de XHTML en créant des librairies de valeurs d’attributs afin d’assurer un nommage commun de la définition d’un document", explique Karl Dubost. "Les tenants des micro-formats sont en train de faire un constat simple : xHTML permet de tout faire, sans avoir besoin d’ajouter une couche XML à côté ou au dessus", complète Stéphane Lee. "Ceux qui connaissent HTML le savent bien : ces attributs sont sous-utilisés, puisqu’ils n’ont aucune signification, sinon pour le concepteur de la page Web en question. Il suffit de se mettre d’accord sur la signification des attributs et de les affecter à bon escient pour que tout prenne un sens !"

Karl Dubost, va encore un peu plus loin pour expliquer les applications à venir de ces formats : "On pourrait imaginer que la présence d’une carte de visite dans une page Web permette d’avoir une fonctionnalité dans le navigateur du type « Ajouter cette carte à mon carnet d’adresse » ou encore qu’un calendrier de conférences, de festivals, de cinéma permette d’ajouter directement une entrée dans son propre calendrier électronique.". Mais voilà... les attributs ne sont pas encore définis ni adoptés, souligne-t-il avec raison. Pour autant que ceux-ci trouvent des dénominations communes, l’avantage des microformats pourrait être de répondre à des besoins ponctuels mieux adaptés à l’inertie des formats. En effet, contrairement à un développement en XML, les microformats ne demandent pas de redévelopper ses pages, mais seulement quelques adaptations sur certaines balises au cas par cas...

Mais comme le souligne Karl Dubost, ils ne rendent pas pour autant le web sémantique accessible à tous - la syntaxe reste ardue -, et ne suppléent pas forcément au besoin de passer, à terme, au XML.

Posté le 18 septembre 2005

©© a-brest, article sous licence creative common info