Open Data culturel : enfin des archives libres, sous le signe du partage à l’identique

J’ai déjà eu l’occasion de l’écrire à de nombreuses reprises : l’ouverture des données publiques s’est avérée délicate dans le champ culturel et c’est en particulier vrai pour les archives, où l’on ne trouvait jusqu’à la semaine dernière aucun exemple de démarche que l’on puisse vraiment qualifier d’Open Data. Mais les archives municipales de la Ville de Toulouse ont publié un nouveau règlement relatif à la réutilisation de leurs données qui démontre que l’Open Data est possible pour les archives. Au-delà du seul secteur culturel, ce règlement est également important, parce que pour la première fois en fois, il comporte une clause de partage à l’identique (Share Alike) directement construite à partir de la loi du 17 juillet 1978. Or ce mécanisme, déjà bien connu du secteur du logiciel libre, est susceptible de jouer un rôle régulateur important dans les rapports entre secteur public et secteur privé, en empêchant le retour d’enclosures sur les données.

Non seulement gratuites, mais aussi libres : les archives de Toulouse sont les premières en France à s’engager dans une démarche d’Open Data. (Free. Par Sharon Drummond. CC-BY-NC-SA)

La gratuité et au-delà

Comme l’explique sur son blog Jordi Navarro, qui a pris part à la rédaction de ce règlement, le premier grand changement introduit par ce texte, c’est le passage à la gratuité, y compris pour les réutilisations commerciales. On ne le répètera jamais assez : il est impossible de parler d’Open Data tant que les usages commerciaux des données publiques font l’objet de l’application d’une redevance. Jordi Navarro explique bien les raisons qui ont motivé le choix de la Ville de Toulouse pour passer à la gratuité, notamment la volonté de simplification du fonctionnement de l’administration :

[...] les Archives municipales ont très rapidement pu constater que [l’ancien règlement] soulevait plus de problèmes qu’il n’en résolvait. La complexité du système (et notamment la difficulté à définir clairement le caractère commercial de certains usages) faisait que la plupart des agents du service étaient eux-mêmes perdus dans ses méandres juridiques. Ils se trouvaient donc dans l’incapacité bien compréhensible de répondre clairement à une demande de réutilisation.

[...] C’est donc tout d’abord un souci de simplification administrative qui a poussé les Archives municipales à revoir leur copie. Et je pense que c’est un point sur lequel il est nécessaire d’insister. Nous le savons, les arguments politiques en faveur de l’ouverture (démocratie, transparence, etc.) ne sont pas toujours suffisants pour convaincre les décideurs.

Il est donc important de constater qu’au delà de l’idéologie, les nécessités de fonctionnement correct d’un service public, peuvent également être un vecteur d’ouverture. Est-ce synonyme d’une « ouverture au rabais » ? Je ne le pense pas. C’est au contraire une corde supplémentaire que les militants de l’ouverture devraient mettre à leur arc. Libérer ses informations simplifie le travail des agents et leur permet de se consacrer à des tâches plus productives. Et croyez-moi, par les temps qui courent, c’est un argument qui peut avoir beaucoup de poids.

Ce type de témoignage est important, notamment à un moment où le Ministère de la Culture, au niveau central, est engagé dans une évaluation des modèles économiques des redevances de réutilisation des données publiques culturelles.

La gratuité est une condition nécessaire, mais ce n’est pas une condition suffisante de l’Open Data. Par exemple (et contrairement à ce que le titre de cet article laisse penser), le département du Rhône a signé avec le site de généalogie NotreFamille.com une licence gratuite de réutilisation des données de l’état civil et des recensements. Ici, il y a bien gratuité, mais le réutilisateur est toujours obligé de solliciter une autorisation préalable et de signer formellement une licence avant que les données soient mises à sa disposition. C’est contraire aux principes de l’Open Data, qui veulent que ce soit l’administration qui fournisse les données de son propre chef et qu’il n’y ait plus d’autorisation préalable à solliciter.

Tous ces éléments font que les archives municipales de la Ville de Toulouse sont bien les premières en France à s’être engagées dans une véritable démarche d’Open Data. Pour cela, leur règlement à mis en place un intéressant système de licences, prenant en compte toutes les dimensions de la question.

Un système complet de licences

Pour que la volonté d’ouvrir des données produisent des effets tangibles, il faut exprimer cette politique par le biais d’une licence pour indiquer les conditions de réutilisation et fournir un cadre juridique sécurité aux utilisateurs. En France, grosso modo, deux licences se partagent le paysage : la Licence Ouverte/Open Licence d’Etalab et l’ODbL (Open Database Licence). La première est l’équivalent d’une CC-BY (Paternité) ; la seconde d’une CC-BY-SA (Paternité – Partage à l’identique).

L’originalité du règlement de la Ville de Toulouse consiste à ne pas s’être contenté de mettre en place une seule licence, mais d’avoir appliqué un ensemble de licences pour prendre en compte toutes les dimensions possibles. Jordi Navarro à nouveau l’explique très bien sur son blog :

[...] quelles sont les ressources proposées par les services d’archives ?

On trouve principalement

  • des informations publiques. Elle peuvent avoir été reçues (état civil, cadastre, recensements…) ou produites (métadonnées descriptives, essentiellement) par le service. Cette catégorie est régie par la loi 78-753.
  • des œuvres de l’esprit (principalement des photographies et des cartes postales anciennes). Celles-ci peuvent, selon les cas, être dans le domaine public, ou non. Dans ce dernier cas, la mairie peut, ou non, en détenir les droits patrimoniaux. C’est ici le code de la propriété intellectuelle qui s’applique, avec toutes ses « subtilités », ses cas particuliers et ses exceptions.
  • Ces deux catégories sont de plus mises à disposition sous la forme d’une base de données, elle même soumise au droit des producteurs de bases de données, dont la mairie est ici la titulaire.

Vous l’avez compris, nous nous trouvons finalement face à un grand nombre « d’objets juridiques », dont les régimes de réutilisation peuvent être très différents. Il convenait donc d’unifier les systèmes pour proposer un régime commun, qui diffère le moins possible selon les catégories de contenu réutilisées.

Pour y parvenir, les Archives municipales de Toulouse ont fait le choix de proposer trois licences différentes :

  1. Les œuvres dont la mairie détient les droits patrimoniaux sont placées sous Creative Commons, avec les conditions BY-SA (libre réutilisation, sous réserve de mention de la paternité et de partage à l’identique).

  2. Les informations publiques, prises individuellement, sont placées sous le régime de la loi 78-753 (libre réutilisation, sous réserve de citer la source), auquel a été ajoutée une condition supplémentaire de partage à l’identique.

  3. En cas de réutilisation d’une partie « substantielle » du contenu de la base (œuvres et/ou informations publiques), alors la licence ODbL s’applique (libre réutilisation, sous réserve de mentionner la paternité, de partager aux mêmes conditions et de garder ouvert le résultat de la réutilisation).

La démarche est remarquable, car elle permet une ouverture complète des objets mis à disposition par le service d’archives, avec un fil conducteur : le partage à l’identique que l’on retrouve dans les trois cas, qui va obliger les réutilisateurs à placer les productions réalisées à partir de ces objets sous la même licence (Share Alike). A noter également que Jordi précise que la question du domaine public sera bien prise en compte et que les oeuvres numérisées appartenant au domaine public feront l’objet d’un marquage spécifique et pas d’un placement sous CC-BY-SA (qui équivaudrait à un copyfraud, comme ici ou ).

Toulouse. La rue Alsace-Lorraine et le square du Capitole. Source : Archives municipales de Toulouse.

Toulouse. La rue Alsace-Lorraine et le square du Capitole. Source : Archives municipales de Toulouse.

J’aimerais attirer surtout l’attention sur le point n°2 figurant ci-dessus, car en construisant un Share Alike à partir de la loi de 1978, les archives de Toulouse ont introduit une innovation non négligeable, dont la portée dépasse d’ailleurs le seul champ culturel.

Un Partage à l’identique sur les données elles-mêmes

Jusqu’à présent, pour libérer des données en les plaçant sous le signe du partage à l’identique, les administrations pouvaient les placer sous la licence ODbL, proposée par l’Open Knowledge Foundation. Cette licence a été utilisée à partir de 2009 par la Ville de Paris, qui l’a traduite en français à cette occasion et elle a été choisie depuis par un certain nombre de collectivités territoriales.

Elle comporte une clause de partage à l’identique formulée ainsi :

Vous partagez aux conditions identiques : si vous utilisez publiquement une version adaptée de cette base de données, ou que vous produisiez une création à partir d’une base de données adaptée, vous devez aussi offrir cette base de données adaptée selon les termes de la licence ODbL.

Carte de l’Open Data en France (LibertTic. GPL + ODbL). En cliquant sur les différentes collectivités, on peut voir les licences utilisées.

L’ODbL est une licence importante, utilisée dans de grands projets comme OpenStreetMap, et elle a eu le mérite d’être la première à adapter la logique des licences libres à la question spécifique des bases de données. Mais elle présente aussi à mon sens quelques défauts, comme celui d’être justement ancrée dans le droit des bases de données, issu de la directive de 1996.

Or celui-ci se caractérise par sa complexité, si bien qu’il peut s’avérer difficile de savoir quand précisément se "déclenche" la clause de partage à l’identique. En effet, le droit sui generis reconnu aux producteurs de bases de données ne s’appliquent pas aux données elles-mêmes, mais à la base, et c’est uniquement lorsque des "extractions substantielles" de données, d’un point de vue quantitatif ou qualitatif, sont effectuées qu’il entre en jeu. La loi ne dit pas exactement ce qu’on doit entendre par extraction substantielle, et c’est la jurisprudence notamment européenne, qui a tracé les contours de la notion, d’une manière relativement compliquée.

Il en résulte une incertitude sur la portée réelle du partage à l’identique appliqué aux bases de données et on n’est finalement pas dans la même situation qu’avec les logiciels libres, pour lesquels la question du "copyleft" est bien balisée. C’est là que le règlement de la Ville de Toulouse apporte à mon sens un vrai plus.

Copyleft. All Rights Reversed.

Car en effet, en plus de retenir l’ODbL pour sa base, la Ville a mis en place un Partage à l’Identique appliqué directement sur les données elles-mêmes, ancré dans la loi du 17 juillet 1978. Ce mécanisme est prévu à l’article 5 du règlement et je graisse ci-dessous les dispositions relatives au Share Alike :

5.1. Informations publiques

Les informations publiques sont réutilisables selon les termes de la loi 78-753 et du contrat de licence de réutilisation des informations publiques dont un exemplaire est annexé au présent règlement.

Le réutilisateur a pour obligation de mentionner la source des informations, sous la forme suivante :« Ville de Toulouse, Archives municipales, cote ». Cette mention devra figurer, de manière visible,à proximité immédiate des informations réutilisées.

Par ailleurs, le sens de l’information publique ne doit pas être dénaturé.

Si le réutilisateur partage l’information publique, il ne peut le faire que sous une licence identique ou similaire à celle-ci.

Si le réutilisateur utilise l’information publique pour produire une création, il n’a le droit de distribuer sa création que sous une licence identique ou similaire à celle-ci.

Si les informations publiques contiennent des données à caractère personnel, leur réutilisation est conditionnée par le strict respect de la loi 78-17 relative à l’informatique, aux fichiers et aux libertés.

Cela avait été l’une des difficultés des débuts de l’Open Data en France de devoir créer une licence adaptée à partir de la loi du 17 juillet 1978. C’est le Ministère de la Justice qui était parvenu le premier à le faire, avec sa licence IP, grâce aux efforts de Thomas Saint-Aubain. La même démarche a été reprise ensuite pour produire la Licence Ouverte/Open Licence d’Etalab, qui s’applique par défaut aux données versées sur data.gouv.fr.

Mais la Licence Ouverte est l’équivalent d’une licence CC-BY, imposant seulement la mention de la source des données. Pour avoir participé aux travaux qui ont présidé à sa rédaction, je sais que l’hypothèse de mettre en place un Partage à l’Identique a été explicitement écartée et que ce choix est désormais fermé aux administrations centrales.

C’est là où le règlement de la Ville de Toulouse est important : il offre l’alternative d’appliquer cette option de Partage à l’identique, non plus à la base de données, mais aux données elles-mêmes. Peu importe qu’une partie substantielle ou non des données figurant dans la base soit réutilisée, le Share Alike s’appliquera et le réutilisateur sera obligée de partager à son tour à l’identique.

Le Share Alike du règlement de la Ville de Toulouse s’applique directement aux données et pas seulement à la base (Data. Par Neerravhbatt. CC-BY-NC-SA)

De plus, l’effet du Partage à l’identique est plus puissant dans le règlement de la Ville de Toulouse que dans l’ODbL , car sa portée va plus loin. Dans l’ODbL, si le réutilisateur produit une "création" à partir des données (imaginons une infographie, une carte, une application, etc), il n’est pas obligé de placer celle-ci directement sous ODbL. C’est seulement si pour ce faire, il produit une base de données dérivée, qu’il devra placer ladite base sous la même licence. Avec le règlement de la Ville de Toulouse, la création elle-même doit être placée sous licence ouverte et c’est la même chose pour le partage des informations "brutes" sans production d’une base de données dérivée.

Cette portée accrue du partage à l’identique est très importante, car elle peut avoir une influence directe sur l’équilibre des relations entre le secteur public et le secteur privé.

Penser les données publiques comme un bien commun, préservé des enclosures

Le champ des archives présente en effet une structure particulière, qu’il ne faut pas oublier. En effet, on est dans une situation où quelques gros acteurs économiques (des firmes comme Ancestry, mais surtout NotreFamille.com) ont atteint une masse critique, qui les place dans une situation privilégié pour l’accès aux données. NotreFamille.com par exemple, s’il pouvait récupérer toutes les données des services d’Archives départementales, deviendrait un point d’accès incontournable à ces informations pour les citoyens, qui devraient alors payer pour le faire.

Le fait que des informations publiques soient réutilisées à des fins commerciales n’est pas un problème en soi (c’est l’un des buts de l’Open Data). Mais on doit se poser la question de savoir s’il est légitime qu’un acteur puisse puiser dans les données publiques et les "enfermer" dans une base propriétaire, sans permettre à son tour la réutilisation.

Si l’on veut que les données publiques constituent de véritables biens communs, au sens fort du terme, alors qu’il faudrait être en mesure de prévenir ces phénomènes de réappropriation exclusive, que l’on peut considérer comme des enclosures. Jordi Navarro avait déjà écrit à ce sujet un billet fondamental sur son blog : "Entre ouverture et enclosure : les biens communs contaminants". Il explique très bien où se situe le risque d’enclosure avec le projet de NotreFamille.com :

Notrefamille.com projette de diffuser [le patrimone culturel], avec cependant deux différences majeures. La première, et pas des moindres, est qu’il faudra cette fois payer pour y accéder. La seconde réside dans la mise en place d’une indexation très fine des actes facilitant la recherche.

[...] Nous avons d’un côté un bien commun, et de l’autre un acteur privé qui souhaite y poser une clôture pour l’exploiter économiquement grâce à un progrès technique. C’est le schéma exact de l’enclosure.

Il serait bien sûr aisé de se dire que cela importe peu tant que, par ailleurs, le patrimoine reste en accès libre. Les citoyens auraient ainsi le choix entre profiter gratuitement de la ressource ou le faire en payant, mais en bénéficiant d’une technique plus performante. Ce serait, en somme, un système gagnant-gagnant, chacun y trouvant son compte.
Sauf que la première clôture aura bien été posée. Le mouvement général tiendrait là son point de départ.

Le projet de Notrefamille.com est donc réellement porteur de ce risque d’enclosure.

Un excellent prezi, toujours par Jordi Navarro, pour expliquer les liens entre Archives et Biens communs.

Un excellent prezi, toujours par Jordi Navarro, pour expliquer les liens entre Archives et Biens communs.

Et il explique ensuite que le moyen de lutter contre l’enclosure ne consiste pas à refuser la réutilisation commerciale (ce qu’un certain nombre de services d’archives ont essayé de faire en vain en s’appuyant sur "l’exception culturelle" de la loi de 1978) ou de faire payer NotreFamille.com par le biais de licences commerciales (ils sont tout à fait prêts à payer s’ils peuvent refermer ensuite). La solution ne peut venir que de la mise en place d’une clause de partage à l’identique qui garantira que les données publiques restent un bien commun :

La réponse à l’enclosure existe et elle n’est pas dans l’interdiction de réutilisation. Elle consiste, je pense, à considérer que le patrimoine est un bien commun et qu’il doit le rester quel que soit son mode d’exploitation. La clôture est interdite, seul l’accès à l’innovation peut être soumis à un paiement. Autrement dit : le patrimoine doit toujours être en accès libre.

[...] Il y aurait quelque chose de noble pour les archivistes à abandonner leurs réticences pour adopter ce genre de licence. Ils feraient ainsi du patrimoine culturel un bien commun contaminant, dont les caractéristiques se transmettraient à chaque création qu’il aurait suscitée. Toute innovation réalisée à partir d’un bien commun devient elle-même un bien commun.

Si l’on applique le règlement de la Ville de Toulouse à un acteur comme NotreFamille.com, il serait obligé de garder un accès ouvert et gratuit aux informations récupérées dans les services d’archives et plus encore, il serait obligé de placer sous la même licence son indexation fine produite à partir de ces données. L’usage commercial reste entièrement possible, mais la stratégie de valorisation ne peut plus être fondée sur le fait d’ériger des enclosures sur ce qui est commun. Il y aurait donc tout intérêt à ce que des services d’archives départementales adoptent le même règlement que la Ville de Toulouse, car ce sont eux les cibles privilégiées par NotreFamille.com.

***

En 2010, j’avais écrit un billet intitulé "Les données culturelles resteront-elles moins libres que les autres ?". Le chemin a été long depuis et les obstacles difficiles à lever, notamment ceux posés par la question épineuse des données personnelles ou par la fameuse "exception culturelle" en matière de réutilisation des données publiques. Heureusement, la jurisprudence a apporté peu à peu des clarifications et même la politique du Ministère de la Culture semble aujourd’hui évoluer en faveur de l’Open Data.

Il faudra rendre hommage au service des Archives municipales de Toulouse d’avoir été les premiers à incarner les principes de l’Open Data dans le secteur des archives. Le règlement qu’ils proposent ouvre une nouvelle voie pour les institutions culturelles, mais au-delà, il réinterroge le processus d’ouverture des données publiques dans son ensemble, en remettant la question du partage à l’identique au centre du débat, et derrière-elle celle de l’équilibre des rapports entre le secteur public et le secteur privé.


Classé dans :A propos des biens communs, Bibliothèques, musées et autres établissemerents culturels, Données publiques et Open Data Tagged : archives, Biens Communs, données publiques, enclosures, licence ouverte, licences, ODbL, open data, partage à l’identique

Binary Data
Via un article de calimaq,

©© a-brest, article sous licence creative common info