@ Brest

Relier et partager autour du web

Des données culturelles à diffuser

La libération des données est loin d’être complètement acquise en France. Si le portail Etalab est une première étape, il reste encore à faire en sorte que les établissements culturels et la recherche s’y mettent.

Les données culturelles ou celles qui concernent la recherche occupent une place particulière parmi les données publiques. Elles restent de fait encore en retrait au sein du mouvement d’Open Data qui se développe en France.

Des données culturelles à diffuser

Reprise d’un article publié sur le site Owni
magazine de journalisme numérique en creative commons

- Lire l’article et ses commentaires sur Owni


Données particulières

En effet, un statut juridique particulier a été fixé par la loi sur la réutilisation des informations publiques, pour les données produites par “des établissements et institutions d’enseignement ou de recherche” ou par des “établissements, organismes ou services culturels”. Ce régime particulier, dit “exception culturelle”, permet à ces établissements de fixer les conditions de la réutilisation de leurs données. Les autres administrations relèvent du régime général de cette loi, qui instaure un véritable droit à la réutilisation des informations publiques au profit des citoyens.

Jusqu’à présent, les institutions culturelles et de recherche se sont plutôt servies de cette exception pour restreindre la réutilisation de leurs données, ce qui a pu faire dire que la culture constituait le “parent pauvre de l’Open Data en France“.

Des tensions sont même apparues entre certains services culturels, de ce point de vue, n’a pas complètement permis de lever les obstacles à la diffusion de ces données. Le Ministère de la Culture et de la Communication, ainsi que celui de l’Enseignement Supérieur et de la Recherche participent bien à data.gouv.fr, et mettent en ligne plusieurs jeux de données.

En effet, les ministères en eux-mêmes ne bénéficient pas de l’exception culturelle prévue dans la loi de 1978, celle-ci n’étant ouverte qu’aux profits des établissements, institutions et services relevant de leurs tutelles ou a fortiori de celles des collectivités territoriales. De ce fait, ces ministères ont dû, de la même manière que tous les autres, se plier à l’obligation, imposée par la circulaire émise le 26 mai 2011 par François Fillon, de verser leurs données dans data.gouv.fr.

La circulaire a posé dans ce cadre un principe de réutilisation gratuite des données publiques, les administrations ne pouvant imposer de redevances que si “des circonstances particulières le justifient” et par le biais de la procédure relativement lourde d’un décret du Premier Ministre.

Néanmoins l’exception culturelle, si elle ne joue pas au niveau des ministères, continue à protéger les établissements publics. En effet, la circulaire du 26 mai 2011 précise que :

L’article 11 de la loi prévoit un régime dérogatoire pour les établissements et les institutions d’enseignement et de recherche ainsi que pour les établissements, organismes ou services culturels qui fixent, le cas échéant, leurs conditions de réutilisation de leurs informations publiques. Ces établissements ainsi que les collectivités territoriales et les personnes de droit public ou de droit privé chargées d’une mission de service public peuvent, s’ils le souhaitent, mettre à disposition leurs informations publiques sur le portail ‘data.gouv.fr’. Dans ce cas, une convention fixe les conditions de réutilisation de ces informations.

La participation à Etalab reste donc facultative pour les organismes culturels ou de recherche et c’est bien ce que traduit la liste des contributeurs, puisque seule la Bibliothèque nationale de France y figure à ce jour, pour une partie de ses données. C’est pourtant au niveau des établissements eux-mêmes que les jeux de données les plus intéressants sont situés (catalogues, instruments de recherche, données bibliographiques, documents numérisées, etc).

Licence ouverte

Cependant, cette mise à l’écart des données culturelles et de recherche n’est pas une fatalité. Car comme j’avais déjà eu l’occasion de le dire, les établissements peuvent user des latitudes dont ils bénéficient au titre de l’exception culturelle pour poser des règles favorables à la réutilisation. Rien ne les oblige à aller dans le sens de la fermeture.

De ce point de vue, Etalab leur offre un instrument essentiel pour mettre en place des conditions ouvertes de diffusion des données : la Licence Ouverte/Open Licence, retenue pour le portail data.gouv.fr.

Cette licence Etalab présente l’intérêt d’être ancrée dans le droit des données publiques français, tout en étant compatible avec les principes de l’Open Data et les licences libres employées dans le cadre de ces initiatives. S’appuyant sur le droit à la réutilisation des données publiques reconnues par la loi de 1978, la licence Etalab permet la réutilisation gratuite, y compris à des fins commerciales, tout en maintenant les exigences minimales du texte et notamment la mention obligatoire de la source des données (paternité).

Depuis l’ouverture du portail Etalab, un seul établissement culturel avait utilisé cette licence Etalab de manière volontaire pour la diffusion de ses données. Il s’agit de la BnF pour les données bibliographiques enrichies qu’elle diffuse au format RDF par le biais du site data.bnf.fr.

Néanmoins la semaine dernière, une autre bibliothèque, la Bibliothèque Nationale et Universitaire de Strasbourg (BNUS) a annoncé qu’elle adoptait la licence Etalab pour se lancer dans une démarche globale de libération de ses données. Uneinterview de l’un des responsable de l’établissement, le conservateur Frédéric Blin, explique la démarche de l’établissement et les raisons l’ayant poussé à faire ce choix.

La première originalité de la BNUS consiste à avoir choisi d’utiliser la licence Etalab aussi bien pour diffuser les métadonnées produites par l’établissement que pour les documents numérisés eux-mêmes, qu’elle produit à partir des œuvres du domaine public qu’elle conserve.

“La décision exacte votée par notre Conseil d’administration est formulée de la manière suivante” :

La décision exacte votée par notre Conseil d’administration est formulée de la manière suivante :

Les données bibliographiques (dont les métadonnées des documents numériques) produites par la BNU sont considérées comme des données publiques et à ce titre placées sous Licence Ouverte ou autre licence compatible (libre réutilisation, y compris à des fins commerciales, sous réserve de mentionner la source de l’information) ;

Les fichiers numériques issus de la numérisation par la BNU d’œuvres du domaine public conservées dans ses collections sont considérés comme des données publiques et à ce titre placés sous Licence Ouverte ou autre licence compatible.

Par ailleurs, Frédéric Blin explique le calcul économique qui a conduit son établissement à renoncer à tarifer les réutilisations à des fins commerciales de ses données :

Avant notre décision, nous appliquions une redevance d’usage, de l’ordre de 35€ par image [...] Cependant, les sommes récoltées par la BNU chaque année au titre de la redevance d’usage étaient minimes, de l’ordre de 3000€. Elles ne couvraient naturellement pas le temps de travail de la secrétaire chargée de gérer les factures et la correspondance avec les lecteurs, ni le temps des autres personnes – y compris de l’Administrateur – impliquées en cas de demande d’exonération ponctuelle ou systématique. En outre, nous espérons que l’abandon de la redevance d’usage entrainera une augmentation des demandes de numérisation de documents, service qui lui restera payant. Dans notre cas particulier, nous pensons qu’en autorisant la libre réutilisation, l’établissement sera au final bénéficiaire au strict plan financier.

D’autre part, nous estimons que la libération des données favorise la créativité artistique et intellectuelle, de même que commerciale : établissement public, il est dans l’intérêt de la BNU de favoriser le dynamisme économique et commercial du pays, créateur d’emplois et générateur de rentrées fiscales. La BNU devient ainsi indirectement une source d’activité économique : le retour sur l’investissement consenti par la Nation pour le financement de la BNU trouve ici une concrétisation potentiellement mesurable.

Cette logique, qui est complètement en phase avec la philosophie de l’Open Data, est hélas fort peu répandue dans le secteur culturel. J’avais eu l’occasion de montrer par exemple, à partir d’une analyse systématique des pratiques, qu’une part écrasante des bibliothèques françaises restreignent l’utilisation des œuvres du domaine public qu’elles numérisent, en recourant à des droits de propriété intellectuelle revendiqués dans des conditions contestables.

La situation n’est pas différente, sinon plus fermée encore, dans les services d’archives et de musées, et le discours au niveau centralreste celui d’une valorisation économique des données, assortie d’une défense de l’exception culturelle.

Quelques établissements commencent à adopter une attitude plus ouverte, en employant notamment la Public Domain Mark, pour les documents du domaine public qu’ils diffusent.

L’exemple de la BNUS ouvre une nouvelle piste, plus générale, par laquelle la licence Etalab permet la libre diffusion à la fois des métadonnées et des documents numérisés.

L’enjeu de ces discussions n’est pas seulement juridique. Il est aussi celui de la participation des données produites par les institutions françaises, culturelles et de recherche, au mouvement général de l’Open Data et à la constitution du web sémantique.

Beaucoup de temps a sans doute été perdu en France autour de débats stériles à propos de cette exception culturelle, dont l’utilité reste encore à démontrer. Pendant ce temps, au niveau européen, une nouvelle directive sur la réutilisation des informations du secteur public est en préparation.

Dont l’un des enjeux est justement à savoir s’il faut maintenir un statut particulier pour les données de la culture et de la recherche.

Posté le 29 mars 2012
©© a-brest, article sous licence creative common info
flickr
20140922_114942
par adam_th
Creative Commons BY-NC-SA