Rions un peu avec le web de données du Ministère de la Culture

En matière de diffusion des données culturelles en France, il y a hélas souvent bien plus d’occasions de pleurer que de rire.

Nightmare Fuel. Par michaeljesusday. CC-BY. Source : Flickr

Cette semaine était cependant un peu plus réjouissante, avec la signature d’une convention entre Wikimedia France, l’INRIA et le Ministère de la Culture autour du projet Semanticpédia, qui vise à sémantiser plusieurs jeux de données issues des projets de Wikimedia. Ce travail collaboratif représente un enjeu important afin que les données culturelles francophones investissent le web de données et il devrait permettre à terme aux institutions culturelles françaises de récupérer des données enrichies pour améliorer la diffusion de leurs contenus en ligne.

A cette occasion, Aurélie Filippetti a prononcé un discours dans lequel c’est la première fois qu’un Ministre de la Culture invite les établissements culturels français à contribuer à l’enrichissement des données de Wikipedia :

Mais ce partenariat ne saurait être à sens unique. Le savoir accessible sur Wikipédia est en perpétuelle construction et peut bénéficier pleinement de l’expertise du ministère. C’est pourquoi nos établissements sont invités à leur tour à consolider, à enrichir ou à rectifier s’il y a lieu les données figurant sur Wikipédia, afin non seulement d’augmenter la qualité de ses articles en langue française, mais aussi son efficacité sur le Web sémantique.

Tout ceci est fort bien et fort beau et je ne conteste nullement que cette signature marque un jalon majeur pour la reconnaissance de Wikipédia, ni que le projet Semanticpedia ait un rôle important à jouer pour le rayonnement de la culture française.

Néanmoins, je suis très loin de partager l’enthousiasme quelque peu débordant qui s’est manifesté notamment sur Twitter chez nombreuses personnes qui ont vu là le signe que le Ministère de la Culture s’apprêtait à « investir le web de données ».

Je resterai au contraire extrêmement prudent à ce sujet, étant donné le flottement qui caractérise la politique du Ministère de la Culture quant à la diffusion des données. La tentation semble en effet particulièrement forte de recourir aux technologies du web sémantique, sans pour autant s’engager dans une démarche d’ouverture de type Open Data.

Comme j’ai déjà eu l’occasion de le dire à plusieurs reprises, la Culture est le mouton noir de l’Open Data en France et cet état de fait était encore rappelé récemment par Claire Gallon de LiberTIC dans une tribune publiée sur OWNI, qui n’hésite pas à parler de « tartufferie » :

Pour preuve, les conflits liés aux données fermées se multiplient et l’absence de soutien politique pour l’extension de l’ouverture à des données d’intérêt général, ou permettant réellement de rendre compte de l’action publique risque de confiner le mouvement français à une logique de publication de données gadgets.

Un premier sujet de déception porte sur la position du ministère de la Culture qui s’est récemment déclaré “favorable à l’ouverture des données culturelles dans un cadre d’exception“. Entendez : oui à l’Open Data, mais sans toucher au cadre juridique actuel qui confère aux données culturelles le pouvoir de se soustraire à l’obligation d’ouverture.

La tartufferie était également au rendez-vous lors du lancement du Centre Pompidou Virtuel, à propos duquel j’ai déjà eu l’occasion de montrer que les données, pourtant sémantisées, sont demeurées sous un régime de fermeture, en dépit des artifices de communication déployés pour nous faire croire que le projet était dans une logique d’ouverture.

J’entends déjà les éminents spécialistes de ces questions m’expliquer, comme ils le font régulièrement dans les commentaires de ce blog, que la sémantisation et l’Open Data sont deux choses différentes et qu’on peut parfaitement faire l’un sans l’autre. Qu’on puisse le faire, c’est chose certaine, mais uniquement au prix d’une dénaturation de la logique du web de données, qui veut que les informations puissent être connectées entre elles et circuler le plus largement possible, afin que cette technologie produise son plein potentiel. Et pour ceux qui en douteraient, je les renvoie directement à Tim Berners-Lee, le père du web sémantique, qui ne sépare pas dans sa vision les considérations techniques de l’ouverture juridique = Open ET Linked Data.

Je vous promettais de rire dans ce billet, alors rions un peu quand même avec ce délicieux web de données à la sauce Ministère de la Culture. Vous allez voir que vouloir « investir le web de données » tout freinant des quatre fers sur l’ouverture peut produire des résultats absolument clownesques !

Un site intitulé data.culture.fr vient en effet d’ouvrir qui diffuse plusieurs thésaurus du Ministère de la Culture, passés au format SKOS, afin de permettre leur utilisation dans le cadre du web sémantique. On y trouve notamment le Thésaurus-matières pour l’indexation des archives locales ou le Thésaurus de la désignation des oeuvres architecturales et mobilières.

Fort bien, mais lorsque l’on essaie de savoir quels sont les conditions d’utilisation de ces jeux de données, on tombe sur une mention Droits indiquant : « Tous droits de reproduction interdits ».

Sémantisation sans Open Data, nous y sommes…

Mais l’amusant dans la chose, puisqu’il faut bien rire un peu au lieu de pleurer, c’est que la même page comporte en bas un point de téléchargement (un dump) pour reproduire ces jeux de données, ainsi qu’un Sparql endpoint, pour que des machines puissent venir s’y brancher. Or cela n’a juste aucun sens de proposer de telles fonctionnalités en maintenant une interdiction générale de reproduction. Ou alors il faut que l’on m’explique comment on peut faire pour télécharger sans copier !

Par ailleurs, pour rajouter une petite pincée de LOL dans ce delirium propriétaire, on notera que pour des gens qui s’intéressent au web sémantique, il y a comme un petit problème avec le sens de cette interdiction.

On nous dit en effet : « Tous droits de reproduction interdits ». Hum…

J’aimerais savoir ce que peuvent être des « droits interdits ». On peut dire que la reproduction est interdite ou que les droits sont réservés, mais des « droits interdits », c’est un oxymore qui me paraît hautement innovant d’un point de vue sémantique !

Tout cela en fait n’a aucun sens, car la politique du Ministère en matière de diffusion des données est complètement incohérente. Certes, on est avide de faire du web sémantique, parce qu’il faut bien en être, mais comme on conserve une conception boutiquière et épicière de la valeur de ces données, on s’arqueboute sur la fameuse exception culturelle pour les fermer, en espérant un jour les transformer en rivière de diamants.

Par ailleurs, on notera que l’interdiction ne mentionne aucun fondement juridique et que l’on ne daigne même pas indiquer aux pauvres citoyens que nous sommes sur la base de quelle loi nous sommes ainsi interdits de reproduction. Ça, dans une démocratie, ça n’est pas de l’exception culturelle, mais tout simplement un mépris pur et simple de l’Etat de droit, qui veut que les administrations doivent toujours s’appuyer sur la loi lorsqu’elles restreignent des libertés. On imagine que c’est la loi du 17 juillet 1978 qui est ici mobilisée, mais dans l’immédiat, nous n’aurons droit qu’au fait du Prince !

Franchement, je recommanderais plutôt à data.culture.fr de se tourner vers la licence CB – Complete Bullshit – inventée par Jérôme Choain. Au moins les choses seraient plus claires !

« Tout article ou image produite sous licence Complete Bullshit est reconnu d’inutilité publique. Tout y est ouvertement faux et scandaleusement mensonger, en général dans l’unique espoir d’aider à la LOLitude ambiante. »

D’ailleurs, le simple fait qu’il existe un data.culture.fr est en soi révélateur. Car les données publiques des administrations centrales doivent normalement rejoindre le portail data.gouv.fr. Sauf que cela implique que les données soient publiées sous la Licence ouverte d’Etalab et entrent dans une démarche d’Open Data, ce qui n’a pas l’air au goût du Ministère…

Toutes ces crispations découlent du fait que le Ministère de la Culture reste crispé sur la notion d’exception culturelle, qui permet aux établissements de décider du régime de réutilisation de leurs données. Une réponse récente d’Aurélie Filippetti à une question parlementaire posée par le député Marcel Rogemont l’a rappelé de manière éclatante :

la loi n° 78-753 du 17 juillet 1978 consacre en son article 11 un régime propre aux informations publiques culturelles. Il en résulte que les établissements, organismes ou services culturels ne sont pas soumis aux dispositions et principes résultant des autres articles du chapitre II de la loi de 1978 notamment son article 10 qui crée un droit, sous certaines conditions, à la réutilisation libre et gratuite des informations publiques.

Cette disposition leur sert, sauf exceptions rarissimes, à rester à l’écart du mouvement de l’Open Data, au nom d’un illusoire espoir de valorisation économique des données. Laurent Chemla a très bien dénoncé cette utilisation de l’exception culturelle dans un de ces papiers sur OWNI :

En France, la ministre de la Culture vient de répondre à la question que les données publiques culturelles sont exclues de la politique de l’Open Data, au nom de leur potentiel économique. Et de l’exception culturelle. Diversité culturelle ? Meilleure diffusion de la culture nationale ? No way les gars : il y a du fric en jeu, contentez-vous de la culture américaine.

De ce point de vue, on peut constater que l’alternance politique n’a absolument rien changé et que cette politique de fermeture et de marchandisation est strictement la même que celle du gouvernement précédent.

Alors même si je suis prêt à admettre que la signature de la convention Semanticpedia est un évènement important, je reste extrêmement sceptique sur la volonté du Ministère d’embrasser réellement les enjeux du web de données, avec toutes leurs conséquences.

Dans son discours, Aurélie Filippetti a pourtant reconnu l’importance des licences libres dans le fonctionnement de Wikipédia :

Le caractère libre et réutilisable des informations présentes sur l’encyclopédie Wikipédia, disponibles sous plusieurs licences ouvertes, est à cet égard un gage de diffusion aussi large que possible des données qu’elle rassemble.

Que n’applique-t-on pas ces belles paroles aux données culturelles elles-mêmes en les plaçant sous la Licence ouverte Etalab et en les diffusant sur data.gouv.fr, plutôt qu’en inventant des conditions burlesques pour les fermer, avec un amateurisme juridique flagrant !

Aurélie Filippetti s’est même risquée à parler de « partage des connaissances » et de « bien commun », à propos du développement du web 3.0 :

Ce système est amené à jouer un rôle essentiel dans la navigation sur

l’Internet, dans la transmission et le partage des connaissances, dans les interactions entre langues et cultures médiatisées par les outils numériques. Pour qu’il participe pleinement au bien commun, il doit être pensé comme un lieu d’échange ouvert, et il importe évidemment que notre langue et notre culture y trouvent leur place.

C’est fort bien de prôner l’ouverture, de parler de bien commun, mais n’oublions pas que dans la réponse à la question parlementaire évoquée ci-dessus, la même Aurélie Filippetti admet que le gouvernement français agit au niveau européen pour maintenir les données culturelles sous un régime d’exception :

[La France] a plaidé pour que ce régime tienne pleinement compte des spécificités de ce secteur et de son économie, qui se caractérise par des besoins élevés d’investissement dans des opérations de numérisation complexes. La France a par conséquent demandé une exemption large et souple au principe de tarification au coût marginal pour les musées, archives et bibliothèques.

J’encourage donc tout le monde à bien prendre en considération ces éléments et à toujours garder en tête quelle est la politique défendue par ce gouvernement en matière de données culturelles.

Il serait souhaitable également que l’engouement pour ces foooormidables technologiques du web sémantique n’agissent pas comme un narcotique puissant, faisant passer au second plan les enjeux de l’ouverture des données.

Des pistes pour débloquer la situation ont été avancées dans le rapport Open GLAM pour l’ouverture des données et des contenus culturels. Ce rapport a été transmis au Ministère, mais il semble bien qu’il n’y ait eu aucun retour à ce jour et ces propositions n’ont pas fait dévier d’un iota la position du Ministère si l’on en croit la réponse faite par Aurélie Filippetti à la question parlementaire de Marcel Rogemont, intervenue après la transmission.

C’est bon de rire parfois, mais c’est mieux encore de pouvoir se réjouir.

Red Noses. CC-BY-NC-ND. Par forchaza. Source : Flickr

A ce titre, la nouvelle récente qui m’a le plus réjoui, c’est d’apprendre que le département du Rhône avait accepté de délivrer une autorisation gratuite pour une réutilisation commerciale de données d’archives. Cette avancée vers l’ouverture est d’autant plus méritoire qu’elle intervient dans un domaine où des questions épineuses de protection des données personnelles se posaient et où la situation avait dégénéré en contentieux, mais le département a prouvé que des solutions pratiques pouvaient être trouvées, au-delà du blocage induit par l’exception culturelle.

C’est un signe fort que les choses peuvent changer par la base, malgré les errances de la politique gouvernementale et peut-être que le projet Semanticpedia pourra aussi aider à aller dans ce sens, comme l’espèrent ses promoteurs.

Mais comme il serait plus simple, plus cohérent et plus bénéfique pour l’intérêt général de sortir par le haut de tout cet imbroglio et par un geste politique clair et fort, de mener enfin de front l’investissement du web sémantique et l’ouverture des données culturelles !

Classé dans :Données publiques et Open Data Tagged : aurélie filippetti, données culturelles, licence ouverte, open data, open glam, semanticpedia, wikimedia france, wikipédia

L’adresse originale de cet article est http://www.revue-reseau-tic.net/Rio...

Via un article de calimaq, publié le 25 novembre 2012

©© a-brest, article sous licence creative common info