Tout est dans tout (y compris Google Books dans Europeana…)

La semaine dernière, lors du congrès annuel de LIBER (l’association des bibliothèques de recherche européennes) a été lancé un nouveau programme Europeana libraries, qui pourrait entraîner un changement de nature décisif pour la bibliothèque numérique européenne.

Mais ce qui m’a le plus frappé, en lisant ces annonces, c’est de constater que ce programme va visiblement permettre à certaines bibliothèques européennes, partenaires de Google pour la numérisation de leurs collections, de donner à Europeana les doubles des fichiers numériques remis par la firme , afin qu’elle les diffuse elle-même.

En cela, Europeana évoluerait vers un modèle proche de celui d’Hathi Trust aux Etats-Unis, cet entrepôt numérique collaboratif des grandes bibliothèques de recherche, qui recueille les fichiers numériques produits par Google afin d’en assurer la préservation à long terme.

Explication… entre les lignes !

Voici ce que l’on trouve sur le site de la Commission européenne pour décrire ce nouveau programme Europeana Libraries (j’ai repris seulement les passages qui me paraissaient importants) :

The Europeana Libraries project will :

1. bring to Europeana the digital collections of some of Europe’s leading research libraries from 11 countries. The content is of the highest quality and is also significant in terms of scale, with some of the largest digital collections in Europe, including extensive collections from Google Books, theses and dissertations from DART-Europe and open-access journal articles via the Directory of Open Access Journals. In total some 5,168,453 pages/images/books and theses/AV clips/articles will be loaded into Europeana as an outcome of Europeana Libraries.

[...]

3. establish systems and processes capable of ingesting and indexing significant quantities of digitised material, including text, images, moving images and sound clips. The outcome will be an efficient and effective library-domain aggregator service for Europeana.

Deux évolutions majeures pour Europeana :

Jusqu’à présent, Europeana n’était pas réellement une bibliothèque numérique, mais seulement un portail d’accès, qui moissonnait les métadonnées des institutions contributrices de contenus et renvoyait par un lien vers leur site pour la consultation effective des fichiers (par le biais du protocole OAI-PMH). Ici, il semble bien qu’il soit question qu’Europeana héberge directement les fichiers, ce qui change sensiblement la donne.
 Les collections numérisées par Google figurent bien parmi les sources de documents qui viendraient alimenter ce projet (extensive collections from Google Books).

En quoi est-ce que cette évolution est importante ?

On le sait (et j’en ai souvent parlé sur S.I.Lex), les bibliothèques partenaires de Google pour la numérisation de leurs collections sont liées au moteur de recherche par un contrat, généralement gardé secret, qui leur impose certaines restrictions d’usage des fichiers leur étant remis à l’issue de l’opération.

Parmi ces restrictions d’usage, on trouve une exclusivité commerciale, mais aussi l’interdiction d’entrer en partenariat avec des tiers pour leur remettre les fichiers afin qu’ils les rediffusent. C’est une chose que l’on constatait par exemple en lisant le CCTP du marché liant la Ville de Lyon à Google (heureusement rendu public suite à une décision de la CADA). Il était notamment indiqué que les partenariats devaient se limiter à « la consultation des fichiers numérisés [par Google] dans le cadre de la bibliothèque numérique propre à la BML et sans transmission des fichiers aux partenaires« . Difficile du coup pour la Bibliothèque de Lyon de remettre ses fichiers à Europeana ou à quiconque…

Pourtant, Google s’est toujours voulu rassurant sur ce point, en garantissant qu’il permettrait les collaborations avec Europeana. Et à chaque fois que Google a signé avec une bibliothèque en Europe, la communication associée à l’évènement précisait que les documents pourraient être « rendus disponibles par le biais d’Europeana« .

Si l’on prend par exemple le dernier gros contrat signé le mois dernier avec la British Library, celle-ci indique sur son site :

The British Library and Google today announced a partnership to digitise 250,000 out-of-copyright books from the Library’s collections [...] Selected by the British Library and digitised by Google, both organisations will work in partnership over the coming years to deliver this content free through Google Books (http://books.google.co.uk) and the British Library’s website (www.bl.uk). Google will cover all digitisation costs [...] It is also planned to make the works available via Europeana (http://www.europeana.eu/), the European Digital Library.

A mes yeux, cette dernière phrase (make the works available via Europeana / Rendre les oeuvres accessibles sur Europeana) relevait surtout de la communication et n’apportait que très peu de garanties, étant donné la manière dont fonctionnait Europeana jusqu’à présent. Je l’avais expliqué lorsque Google avait signé avec la Bibliothèque nationale d’Autriche :

Pour prouver l’absence exclusivité, on nous dit également que les ouvrages seront accessibles dans Europeana. Ce sera certainement vrai, mais ce type d’accès ne prouve absolument rien ! Le fait que les ouvrages soient accessibles par le biais d’Europeana ne veut pas dire que Google va remettre une copie des ouvrages à la Bibliothèque et une autre à Europeana. C’est méconnaître la manière décentralisée dont fonctionne Europeana.

En effet, Europeana n’est pas une bibliothèque numérique au sens propre dans la mesure où elle ne stocke pas les fichiers des oeuvres auxquelles elle donne accès. Il s’agit d’un simple portail permettant la recherche fédérée à partir d’un ensemble de ressources qui sont stockées sur les serveurs des établissements culturels partenaires au niveau national. On ne consulte que des notices sur Europeana qui sont collectées par le biais du protocole OAI-PMH. Pour la consultation des oeuvres, il faut suivre un lien hypertexte qui renvoie vers le site des établissements partenaires.

Dès lors, le fait que les livres de la BN d’Autriche soient accessibles par le biais d’Europeana ne nous dit absolument rien sur sa capacité à donner les fichiers eux-mêmes à des tiers et Google n’a quand même pas encore le pouvoir d’interdire les liens hypertexte !

Mais si le nouveau programme Europeana Libraries aboutit à ce qu’Europeana évolue pour héberger et diffuser par elle-même des fichiers, alors les réserves que j’émettais ci-dessus tombent et cela signifiera que Google aura accepté de mettre à disposition ses fichiers.

Or dans la liste des établissements partenaires du programme Europeana Libraries, on trouve effectivement plusieurs bibliothèques qui ont un accord de numérisation avec Google et qui pourraient donc verser des fichiers produits par la firme dans Europeana :

Université d’Etat de Bavière
Université Complutense de Madrid
Université de Gand
Université d’Oxford

Bien sûr, cela ne nous dit pas encore complètement si ces fichiers seront couverts ou non par les exclusivités figurant dans les contrats Google, mais cette nouvelle est tout de même encourageante et Google semble de toutes façons revenir peu à peu sur les restrictions qu’il exigeait auparavant (voir ici pour les Etats-Unis et là pour l’Europe).

Si Europeana « ingère » effectivement des fichiers en provenance de Google Book, alors elle pourrait connaître une évolution semblable à celle de Hathi Trust, l’entrepôt numérique partagé par les grandes bibliothèques américaines, Google ayant explicitement accepté que ses partenaires y versent leurs fichiers en masse.

Une différence notable serait toutefois qu’Europeana ne contiendrait que des ouvrages du domaine public (les bibliothèques européennes ayant refusé de confier à la firme la numérisation d’oeuvres protégées), alors qu’Hathi Trust contient une grande proportion d’ouvrages sous copyright (73% selon cette excellente présentation).

Cette évolution est sans doute bénéfique, pour garantir la préservation de ces fichiers à long terme, ainsi que renforcer la maîtrise sur ce patrimoine numérisé. Mais on se demande comment sera financée la mise en place des coûteuses infrastructures nécessaires pour qu’Europeana ne soit plus un simple portail, mais devienne une véritable bibliothèque numérique…

Filed under : Bibliothèques, musées et autres établissemerents culturels, L'affaire Google Book Search Tagged : Bibliothèques, Europeana, Google Book Search, Numérisation

L’adresse originale de cet article est http://www.revue-reseau-tic.net/Tou...

Via un article de calimaq, publié le 10 juillet 2011

©© a-brest, article sous licence creative common info