Découvrir les systèmes d’agrégation automatiques de contenus

Présentation de l’article publié par jean Luc Raymond sur Ecrit-Public.net

@-brest essaie de relier les initiatives d’appropriation des nouvelles technologies au pays de Brest et ailleurs.

Après l’accés public à internet, la découverte de l’écrit public, il nous est possible aujord’hui de relier directement les écrits des uns et des autres par des systèmes automatiques.

L’agrégation de contenus, intégrée dans les systèmes de publication est une étape importante du développement de l’écrit public. Les technologies (fils RSS, syndication, normes XML) facilitent l’accés à l’informaton produite localement et donne encore davantage à voir les écrits des uns et des autres.

Merci à jean luc Raymond de sa contribution écrite complément de sa participation appréciée à la commission usages Mégalis de Lannion sur les systèmes dynamiques et l’agrégation de contenus.

Voici ci-dessous l’introduction de l’article qu’il a publié sur ecrit-public.net, le site du réesau francophone del ’ecrit-public qu’il co-anime.

Document publié originellement sur le blog didactique klogfr et produit dans le cadre de la rencontre RUR@L TIC organisée par le Pays du Trégor-Goëlo (le 24 septembre 2004), et plus spécifiquement dans le cadre d’une intervention intitulée "Systèmes automatiques d’agrégations de contenus" pour la réunion professionnelle du Syndicat mixte Mégalis Bretagne, Commission "Usages et Services aux Citoyens" coordonnée par Michel Briand.

Ce document est à compléter dans sa lecture par des ressources sur l’agrégation de contenus déjà publiées sur le blog didactique :

PREAMBULE

Aujourd’hui et dans l’avenir, l’agrégation de contenus tend à redéfinir, via l’utilisation et l’usage d’outils automatisés liés à l’informatique et à l’Internet, le schéma d’information, de communication et d’échange d’une manière générale et, pour ce qui nous préoccupe, dans le monde des collectivités locales, le schéma informationnel entre les employés, la structure hiérarchique traditionnelle fonctionnariale dans son fonctionnement, le tissu économique et social local, le monde associatif et les citoyens.

L’AGREGATION DE CONTENUS : UNE NAISSANCE A LA CROISEE DES CHEMINS DU WEB

L’agrégation de contenus est née aux Etats-Unis en 1997 (http://davenet.scripting.com/1997/12/15/scriptingNewsInXML) autour de la norme RSS à partir d’un croisement d’idées entre la navigation internet (navigateur Netscape), la publication personnelle (Dave Winer et son logiciel de publication personnel et collectif de contenus devenu Radio Userland) et le langage informatique dit XML.

L’une des problématiques de l’agrégation de contenus est de pouvoir, du point de vue de la personne productrice d’information (au sens "data", donc informatique du terme) mettre en ligne une information organisée et structurée de manière à ce que celle-ci puisse être rediffusée, échangée voire réutilisée sur Internet ou hors ligne.

Du point de vue de l’internaute utilisateur de cette information, l’agrégation de contenus obtenue va lui permettre d’effectuer un travail de sélection organisé de l’information, d’archivage, de redistribution et d’échanges "in fine" en ligne.

QUE CONTIENT DANS LES FAITS CETTE INFORMATION PRODUITE DITE "FIL DE NOUVELLES" ?

Tout d’abord, il s’agit d’une description basée sur une syntaxe (organisation langagière informatique) :

  • la norme de syndication utilisée : RSS, Atom (et ses versions afférentes),
  • le titre du site Web produisant l’information,
  • le canal, c’est-à-dire l’adresse générique du site Web produisant l’information (ou URL générique),
  • la date et l’heure de production du document en ligne (et éventuellement de sa modification),
  • la langue utilisée (exemple : le français),

Puis, des informations relatives à chaque article diffusé en ligne :

  • titre de l’article,
  • lien de l’article (URL),
  • la date et l’heure de sa mise en ligne (et éventuelle modification),
  • l’auteur de l’article (nom),
  • l’éventuelle catégorie/rubrique spécifique attachée à l’article,
  • la description de l’article, c’est-à-dire une partie de l’article (premiers mots, voire titre et chapeau, voire titre et résumé) ou son intégralité (c’est un choix du diffuseur).

Le contenu produit peut être textuel, mentionner des hyperliens, être de nature sonore et vidéo. Ce contenu produit dit "syndicable" ou "fil RSS" ou "fil de nouvelles" ne respecte pas la mise en page du site Web traditionnel mais mentionne avec fidélité son contenu.

Exemple : en indiquant l’adresse suivante dans votre navigateur Web préféré : http://mediatic.blogspot.com/rss/mediatic.xml , vous pouvez visionner le contenu syndiqué généré par le site Web suivant : http://mediatic.blogspot.com.

COMMENT PRODUIRE ET GENERER CES DONNEES A PARTIR D’UN SITE WEB ?

Tout site Web dynamique en .php, perl ou .asp ou utilisant le logiciel de publication de contenu SPIP, des logiciels de blogs (Dotclear, WordPress...) ou plate-formes en ligne de blogs (tels Blogger, LiveJournal, etc.) ou CMS (systèmes de gestion de contenus) génèrent automatiquement ces fils de nouvelles qu’il est éventuellement possible de personnaliser (partie de l’article à diffuser (premiers mots, voire titre et chapô, voire titre et résumé) ou de diffuser dans son intégralité.

Vous pouvez obtenir ces renseignements auprès du concepteur du site Web en question pour savoir quel contenu est généré, sous quelle norme (RSS, Atom... ?).

Vous pouvez diffuser un seul flux ou catégoriser ces flux par rubriques (pour une plus grande personnalisation).

Il existe aussi des services gratuits pour créer ou générer un fil de nouvelles pour votre site Web. Cette génération a un coût très faible voire gratuit.

Posté le 28 septembre 2004 par Michel Briand

©© a-brest, article sous licence creative common info