In-extenso, moteur de recherche des sciences humaines et sociales

Ce moteur de recherche spécialisé explore une partie sélectionnée de la « Toile mondiale » : les pages consacrées aux sciences humaines et sociales.

Une information reprise de la lettre d’informations Revues.org

C’est avec plaisir que nous vous annonçons dans cette lettre du mois d’octobre l’ouverture d’In-extenso, le premier moteur de recherche des sciences humaines et sociales.

Alors que le corpus des documents en ligne en sciences humaines et sociales a pris consistance, l’enjeu est désormais de le repérer, de l’indexer et d’élargir sa visibilité. Consciente de cette nécessité, l’équipe de Revues.org a mené pendant quatre années une expérience d’indexation. Cette démarche dépasse aujourd’hui le stade expérimental. Elle a pour nom In-extenso et prend la forme originale d’un moteur de recherche à deux étages.
L’étage « OAI » (pour Open archives initiative) donne accès à une vingtaine de dépôts de documents scientifiques (au rang desquels on compte Gallica, Hal-SHS, Cyberthèses, Persée, Revues.org...), soit 135 000 documents environ.

L’étage « web » indexe le contenu de 2 000 sites web dédiés aux sciences humaines et sociales (Universités, laboratoires, sites thématiques, expositions, publications diverses...), ce qui constitue un corpus d’une taille inédite : plus de quatre millions de pages web. Minuscule, au regard de la taille des grands moteurs généralistes (plus de huit milliards de pages en général), gigantesque, au regard de l’ambition d’un moteur dont le corpus doit être contrôlé, ce nombre est atteint grâce à l’alliance d’In-extenso avec L’Album des sciences sociales. L’étage « web » indexe le contenu des 2 000 sites sélectionnés par L’Album des sciences sociales, le répertoire critique de ressources électroniques en sciences humaines et sociales, réalisé dans le cadre de Revues.org par une équipe de chercheurs et de documentalistes.

In-extenso est la première initiative de ce type à dépasser le stade expérimental. Pour un historique, on peut lire les billets écrits à ce sujet dans Blogo-numericus (1) (2). Il faut espérer que le projet sera imité, afin de constituer des moteurs de recherche spécialisés, plus précis, plus pratiques, plus ouverts, plus efficaces. En ce domaine, le monopole d’un acteur, fût-il aussi connu que Google ou que son dérivé académique (le décevant Google scholar), n’est pas souhaitable.

In-extenso a vocation à s’améliorer grâce à la contribution des équipes de rédaction de L’Album des sciences sociales et des utilisateurs du moteur In-extenso. N’hésitez pas à signaler les lacunes apparentes et le caractère peut-être étonnant de certains résultats. Malgré l’immensité du travail accompli, celui qui reste à réaliser est considérable. Écrivez-nous à in-extenso@revues.org, nous serons sensibles à votre participation.

  • À lire également

Pour le Comité de rédaction de Revues.org

Marin Dacos
Responsable de Revues.org

Posté le 5 octobre 2006

licence de l’article : Contacter l’auteur