Loi numérique : quels amendements pour le libre accès ?

Au cours de l’année écoulée, nous avons suivi de près l’élaboration d’une loi open access à la française, qui fait partie intégrante de la loi sur la société numérique. Une loi open access vise à lever le principal obstacle restreignant le développement du libre accès : les droits d’exclusivité dont disposent les éditeurs de revues ; lorsqu’ils souhaitent diffuser leurs publications les chercheurs. Pour y remédier, une recommandation européenne de 2012 a élaboré le mécanisme juridique suivant : toute recherche financée au moins par moitié par fonds public pourra être republiée sous une licence non-commerciale au terme d’une durée maximale de 6 mois à 1 an ; tous les engagements contractuels contraires pris entre les auteurs et l’éditeur expirent au terme de cette date.

Les différents épisodes de ce feuilleton législatif (qui incluent également, pratique inhabituelle, une consultation publique ouverte à tous) ont apporté leur lot de bonnes et de mauvaises surprises. Par rapport au projet initialement envisagé, le dispositif finalement retenu par l’exécutif (art. 17) est plus ambitieux dans deux domaines : les durées d’embargo (qui passent, respectivement de 24 à 12 mois dans les Sciences Techniques et Médicales) et la diffusion des données associées à l’article (dont « la réutilisation est libre »). Par contre, deux mesures complémentaires importantes ont disparu : la mise en place d’une exception pour les projets scientifiques de text mining et la reconnaissance positive du domaine public (qui vise notamment à contrecarrer le copyfraud).

Après la publication du projet de loi finalement retenu par le conseil des ministres et l’examen du conseil d’État, nous en entrons dans une nouvelle phase : le débat législatif. Les amendements des parlementaires ont été publiés hier. Au total, j’en dénombre 430 à la commission des lois et 14 à la commission des affaires culturelles. Je me suis permis d’extraire automatiquement leur contenu à partir d’un petit scraping en python, ce qui me permet d’effectuer des requêtes plus précise et, accessoirement, de me laisser aller à une pratique délicieusement trollesque : du text mining, peut-être illégal, sur des amendements qui visent justement à autoriser le text mining  :

assemble_link = codecs.open("/Users/pclanglais/Desktop/assemble_link.txt", "r")
assemble_link = assemble_link.read()
assemble_link = assemble_link.split('\n')
for link in assemble_link:
	finallink = re.sub(ur"http://www.assemblee-nationale.fr/14/amendements/3318/CION_LOIS/", ur'', link)
	finallink = re.sub(ur".asp", ur'', finallink)
	extractnotice(link, finallink)
	time.sleep(3)

Une confirmation de la loi open access

Commençons par les mesures qui concernent exclusivement les chercheurs. Actuellement, le dispositif principal de la loi open access est visé par une vingtaine d’amendements (dont la moitié dans la commission des affaires économiques). Ils n’apportent que des préconisations assez subsidiaires. Tirant clairement les conclusions d’une consultation publique très favorable à l’open access, le texte finalement adopté en conseil des ministres a déjà pris en compte plusieurs revendications majeures (l’intégration des données dans le dispositif de la loi et l’abaissement des durées d’embargo, en conformité avec la recommandation européenne de 2012). En fait, j’anticipais plutôt un retour en arrière. Il n’a, pour l’essentiel, pas eu lieu (exception faite d’une série d’amendements en commission des affaires économiques soutenus par seulement trois signataires).

Cinq amendements portent sur les durées d’embargo. Trois d’entre eux pointent l’irrecevabilité de deux durées distinctes pour les Sciences Techniques et Médicales (6 mois) et pour les Sciences Humaines et Sociales (12 mois). AC7 et CL340 recommandent le passage général à 6 mois, tandis que CL289 préconise 12 mois. AC17 propose une alternative intéressante (mais qui risque de devenir rapidement peu lisible) : autoriser le ministère de la recherche à introduire des « délais inférieurs » discipline par discipline (ce qui permettrait concrètement d’abolir totalement l’embargo). Pour des raisons pratiques, je préconiserais plutôt un régime général de 6 mois (même si pas d’embargo du tout serait une situation encore préférable…). Enfin, le CE104 s’inscrit dans une dynamique rétrograde en revenant aux durées initialement prévues : 24 et 12 mois pour les SHS et les STM.

Sur les modalités de republication, le CL339 apporte une spécification utile : les publications doivent non seulement être mises à disposition gratuitement mais dans un « format ouvert » (par exemple csv pour les données, OpenOffice ou HTML pour les articles, plutôt que respectivement excel et word). Le CE67 propose les mêmes spécifications.

Deux amendement concernent le statut des données scientifiques. Ils apportent peu de chose. En prescrivant d’intégrer les « données sources » CL288 est redondant avec la loi dans son état actuel (qui met déjà les données associées à l’article en libre accès). CL473 ajoute une restriction de réutilisation par rapport au régime actuel le régime actuel (qui consiste approximativement à placer les données sous une licence de type CC0, en retirant toute forme de droits patrimoniaux et moraux) : il vise à astreindre toute utilisation à « faire référence à la source utilisée ». On basculerait ainsi plutôt dans un système de licence proche de la CC-BY ou de l’ODBL.

La réutilisation commerciale est remises en causes par plusieurs amendements (peu soutenus) recommandant des restrictions additionnelles. AC18 souhaite une mention explicite de l’interdiction de tout usage commercial (en dehors d’une rédaction différente, ça ne change rien au fond de l’art. 17). Soutenus par le même groupe de trois parlementaires plutôt rétifs à une loi open access, CE167 et CE102 tentent respectivement d’édicter une restriction commeciale générale (et non seulement dans le cadre de l’édition scientifique) et d’intégrer les réutilisation « indirectement » commerciales.

Pour AC19 il est souhaitable de commander une étude d’impact en 2019, soit trois ans après l’adoption de la loi.

Je n’ai vu que deux amendements portant sur le type de publications concernées. AC22 préconise de publier tous les manuscrits intermédiaires (et non, uniquement, la version finale approuvée par l’éditeur) : alors que l’écrit scientifique devient de plus en plus une production in progress associant plusieurs versions distinctes, l’idée me paraît intéressante. Inversement, CE103 (toujours le même groupe rétif à l’open access) prescrit d’exclure les « recueils de mélanges » du cadre de la loi.

Dans l’ensemble il y a finalement peu de choses. Seules les durées peuvent peut-être encore changer, au risque de braquer les éditeurs en SHS ou les chercheurs en STM selon que l’harmonisation se fait à la baisse ou à la hausse.

La configuration actuelle n’était pas trop favorable à un lobbying acharné des éditeurs scientifiques. Les petits éditeurs en Sciences Humaines et Sociales ont été apparemment rassurés par la mise en œuvre d’une politique de subvention pour accompagner leur conversion à l’open access. Les grandes multinationales ont d’autres chats à fouetter. Suite aux contrats signés l’année dernière les universités continuent de verser des millions à Elsevier. D’ici l’expiration des contrats, le marché aura complètement changé en Europe (avec une conversion probable vers le modèle open access gold ou auteur-payeur). Même avec l’adoption de la loi sur le numérique, la France reste, du point de vue de ces acteurs, un cas beaucoup moins problématique que les Pays-Bas, le Royaume-Uni ou l’Allemagne.

La résurrection de l’exception au text mining

L’exception au titre du text mining avait été rapidement retirée du projet de loi : elle ne figurait pas dans le texte soumis à une consultation publique. À l’instar de l’avocat du Syndication National de l’Édition, Richard Malka, les ayant-droit avaient tirés à boulets rouges sur cette exception : dans une brochure intitulée La Gratuité c’est le vol (pourtant diffusée… gratuitement), il assimilait l’extraction automatisée à des fins scientifiques à un « pillage ».

Pourtant, cette exception existe aujourd’hui dans des pays aussi marxistes que le Royaume-Uni (depuis 2014) ou, de facto, aux États-Unis (suite à l’adoption d’une jurisprudence favorable, dans le cadre du procès Google Books) ; elle est actuellement sérieusement envisagée dans la réforme européenne du droit d’auteur. L’exception vise davantage à clarifier une zone grise qu’à créer un nouveau droit : l’enjeu est d’établir que, dans la recherche scientifique, le droit d’extraire est indissociable du droit de lire. Plus que le droit d’auteur, le droit des bases de données constitue le principal obstacle : il empêche toute forme de copie substantielle d’une base de données protégée. Or, les projets de text mining à grande échelle impliquent nécessairement une recopie significative voire intégrale d’une base.

Le débat parlementaire redonne des chances à l’exceptions. Elle est actuellement recommandée par pas moins de sept amendements (AC11, AC16, CL84, CL344 et CL463, CE29 et CE78). La mesure est œcuménique : elle est souhaitée aussi bien par des parlementaires de gauche (CE29 pour les communistes, CL344 pour des écologistes et indépendants (Attard), CL463 pour les socialistes) que par des parlementaires de droite (le seul CL84, mais adopté par un grand nombre de signataires).

La rédaction est quasiment identique (je n’ai pas détecté de variations notables). Elle prend la forme de deux dispositions. La première décrit le cadre général de l’exception : les copies numériques de « sources licites » sont autorisées pour les « besoins de la recherche publique ». Par contraste avec l’exception initialement envisagée par la Loi sur le Numérique, les parlementaires insistent sur la nécessaire conservation des données résultant de l’extraction automatisée :

2° Après le 4° de l’article L. 342‑3, il est inséré un 5° ainsi rédigé :« 5° Les copies ou reproductions numériques de la base réalisées par une personne qui y a licitement accès, en vue de fouilles de textes et de données dans un cadre de recherche, à l’exclusion de toute finalité commerciale. La conservation et la communication des copies techniques issues des traitements, au terme des activités de recherche pour lesquelles elles ont été produites, sont assurées par des organismes désignés par décret. Les autres copies ou reproductions sont détruites. »

En l’état l’exception au text mining dispose de chances significatives. Elle peut compter sur des soutiens significatifs dans les principaux partis (ainsi que sur l’approbation tacite des principaux acteurs concernés : les chercheurs) ainsi que sur la concrétisation parallèle d’une exception similaire au niveau européen.

Vers un retour des communs ?

En dehors du strict cas de l’open access une trentaine d’amendements portent sur l’art. 17 ou sur l’art. 18 (qui cible plus précisément la réutilisation des données personnelles à des fins de recherche). Ils ne se limitent d’ailleurs pas à l’open access. Comme les deux articles sont les seuls survivants d’une section plus largement consacrée à « l’économie des savoirs », plusieurs amendements visent à rétablir la section sur les communs informationnels et la reconnaissance positive du domaine public (AC8, AC9, AC13, CL117, CL341, CL342, CL460, CL461).

D’autres s’attachent à mettre en œuvre une exception souhaitée de longue date par les chercheurs et les projets de libre diffusion des connaissance : la liberté de panorama (AC10, AC15, CL30, CL88, CL343, CL462). Comme je le rappelais dans un billet sur Rue89 il y a quelques années, l’espace public français est actuellement « troué » : les architectes conservent des droits d’auteurs sur leurs réalisations ce qui rendent la plupart des photographies urbaines de facto illégales.

Sciences communes

URL: http://scoms.hypotheses.org/
Via un article de Pierre-Carl Langlais, publié le 12 janvier 2016

©© a-brest, article sous licence creative common info