Quel paysage juridique pour l’exploration de données ?

Puits_CambefortUne fois n’est pas coutume sur ce blog. Voici un article que j’avais écrit avec Joachim Schöpfel, maître de conférences à l’Université de Lille 3, pour le numéro 2017/2 d’Information, Données & Documents.

*

La future directive européenne sur le droit d’auteur contiendra des dispositions en faveur du text and data mining (exploration de données, TDM). À l’heure où les mesures juridiques envisagées font encore l’objet de débats, il paraît utile de faire le point sur la question.

Face au déferlement du Big data, il existe aujourd’hui toute une panoplie d’outils d’intelligence artificielle pour explorer et analyser de grands volumes de données (textes, statistiques, mesures, métadonnées, etc.) afin d’en extraire des informations significatives (corrélations, structures, etc.) par des traitements automatiques (algorithmes). Ces traitements impliquent l’accès (légitime ? légal ?) aux données à analyser mais également leur extraction et reproduction sur d’autres supports, leur transformation, diffusion et stockage.

Les enjeux économiques mais aussi scientifiques sont immenses. Dans le domaine scientifique, comme le souligne un rapport d’un groupe d’experts européens, le text and data mining (TDM) est un défi majeur pour la productivité des chercheurs. Un rapport du Research Consulting souligne que le TDM favorise la diffusion et la performance de la recherche scientifique mais aussi que les chercheurs français risquent de prendre du retard sur d’autres pays, face notamment au Royaume-Uni. Cependant, les droits en lice, dont notamment le droit d’auteur et ses exceptions (courte citation, copie technique, recherche), le droit des bases de données ou encore la protection des données personnelles, ne sont pas adaptés et constituent de véritables verrous à l’application des outils du TDM [1]. Accès autorisé n’est pas toujours synonyme de libre utilisation. Des droits sont, en effet,nécessaires pour les copies successives, les sélections d’extraits, les communications aux publics, etc. Tout mode d’exploitation représente un droit à avoir (loi) ou à négocier (licence).

Le cadre européen et la situation française

Alors que l’ancienne directive de 2001 ignorait le TDM, l’article 3 de la proposition d’une nouvelle directive prévoit une exception au droit d’auteur autorisant le TDM. Cette exception, qui s’imposerait à tous les États membres, s’appliquerait aux «  reproductions et extractions effectuées par des organismes de recherche, en vue de procéder à une fouille de textes et de données sur des œuvres ou autres objets protégés auxquels ils ont légitimement accès à des fins de recherche scientifique ».

La proposition de la Commission européenne a été réexaminée par des commissions de travail au sein du Parlement européen (commissions des Affaires juridiques, Culture et éducation, Industrie, recherche et énergie et Marché intérieur et protection des consommateurs) avant débat en séance plénière prévue en juillet et avant son adoption (éventuelle) fin 2017.

Sans attendre la nouvelle directive, la France a voulu encadrer le TDM par l’article 38 de la loi du 7 octobre 2016 pour une République numérique. Cet article autorise « les copies réalisées à partir d’une source licite, en vue de l’exploration de textes et de données incluses ou associées aux écrits scientifiques pour les besoins de la recherche publique sans finalité commerciale ». Cette même exception s’applique aux bases des données.

Rédigé en concertation avec les différents acteurs, un décret d’application aurait dû fixer les conditions de la mise en œuvre et les modalités de conservation et de communication des fichiers produits au terme des activités de recherche et des copies techniques issues des traitements pouvant être conservées. Or, le Conseil d’État a rendu un avis négatif sur cet article, non sur le fond (le principe d’une exception pour le TDM a été confirmé) mais sur le fait qu’il introduit une nouvelle exception dans la loi française en dehors du cadre européen actuel, c’est-à-dire de la directive de 2001.

Après cet avis, l’article 38 restera inapplicable et inappliqué. Il faudra donc attendre la nouvelle directive et sa transposition en droit français (fin 2017 ? 2018 ?) pour clarifier la situation juridique en France. En attendant, le gouvernement souhaite transformer ce décret en protocole d’accord entre les différents acteurs concernés (éditeurs, producteurs de bases de données, etc.), sans résultat tangible à ce jour (juin 2017).

Loi ou licence ?

Une exception au droit d’auteur permet de se passer d’autorisation expresse. Mais cette liberté est très encadrée et toute modification législative est difficile et longue à obtenir. Le contrat, plus souple, permet toute négociation mais il faut avoir le poids nécessaire pour négocier et ce système implique de multiplier les négociations. Aussi, obtenir les droits de TDM avec des licences (comme pour la plateforme Istex) a sans doute un coût et risque des distorsions entre ceux qui ont les moyens de négocier et les autres.

Par ailleurs, la proposition européenne prévoit que toutes les dispositions contractuelles qui empêchent la mise en œuvre de l’exception seront nulles et non avenues.

Champ d’application, bénéficiaires et bénéfices

La loi française limite l’exception aux « écrits scientifiques » sans précision (articles ? thèses ? communications ?). La directive européenne est plus large et parle de l’œuvre protégée par le droit d’auteur, y compris par exemple la presse ou d’autres créations grand public. La loi française limite l’exception à la recherche publique. Interdisant, par ailleurs, toutes finalités commerciales (PME, start-ups, etc.), qu’en est-il des partenariats publics/privés ou des finalités commerciales indirectes ? Pas de limite de ce type pour les instances européennes qui parlent de recherche scientifique en accordant ce droit, pour certaines commissions du Parlement européen, à une personne, pour d’autres, à des d’organismes de recherche, d’autres encore à tous, personnes morales, publiques et privées, et personnes physiques.

Accès licite, accès légitime, compensation

L’article 38 de la Loi pour une République numérique prévoit que la copie se fasse à partir de sources licites. Au niveau européen, on parle d’accès légitime aux œuvres et objets protégés, un terme bien plus large. L’une des commissions de l’UE précise qu’il s’agit d’œuvres acquises pour faire du TDM et non d’un simple accès. D’autres commissions insistent sur le versement d’une compensation financière aux ayants droit pour l’éventuel préjudice encouru par l’usage de leurs œuvres ; pour une commission, cette compensation serait à verser par les chercheurs qui n’auraient pas un accès licite aux données (publications) pour qu’ils puissent au moins avoir accès aux données « normalisées » afin de couvrir les frais de formatage des jeux de données par les ayants-droit.

Les mesures techniques de protection et la conservation des données

Destinées à assurer la sécurité et l’intégrité des réseaux et bases de données, les mesures techniques de gestion des droits (digital rights management, DRM), pour la Commission européenne, ne doivent pas « excéder ce qui est nécessaire pour atteindre cet objectif » et des bonnes pratiques en la matière seront à définir en commun par les titulaires de droit et les organismes de recherche. Pour certaines commissions du Parlement européen, ces mesures seront proportionnées et ne doivent pas empêcher les organismes de recherche de bénéficier des exceptions. Pour d’autres, il incombe à la Commission européenne d’encourager les bonnes pratiques et le partage d’expériences au sein de l’UE. Toute mesure technique incompatible avec l’exception sera nulle, précise-t-on aussi, par ailleurs.

En France, le décret rejeté avait prévu que la conservation des copies techniques des traitements TDM soit assurée par un organisme désigné et les autres copies détruites. Détruire les copies une fois les activités de TDM effectuées, désigner des organismes gestionnaires des réservoirs de données accessibles à des fins de contrôle, c’est ce que prévoient aussi certaines commissions du Parlement européen

Quelle suite ?

A priori, l’UE devrait adopter la nouvelle directive avant fin 2017. Toujours a priori, dans la mesure où il existe déjà un décret d’application consensuel, la transposition de la partie TDM dans la loi française pourrait se faire rapidement. Sachant que, pour l’instant, le projet européen va plus loin que le l’article 38 de la Loi numérique, aussi bien par rapport au champ d’application que pour les bénéficiaires, on peut se demander si la transposition se limitera à confirmer la loi actuelle ou si elle élargira son périmètre dans le sens de la directive européenne, ce qui nécessiterait sans doute de nouvelle discussions avec les partenaires et acteurs du TDM.

Aujourd’hui, sans décret d’application et directive européenne, il est trop tôt pour faire un bilan définitif de la nouvelle situation juridique. Le débat européen reste ouvert ; les uns insistent sur la nécessité de limiter l’usage et les bénéficiaires et de clarifier les traitements concernés (normalization of information) tandis que les autres préviennent qu’une limitation de l’exception aux seuls organismes de recherche ne serait pas seulement impraticable mais signifierait la fin pour beaucoup de producteurs d’analyses de données (starts-ups) en Europe. Les prochains mois nous diront si l’action publique légale mais aussi financière est à la hauteur des enjeux ou s’il faut aller plus loin pour rattraper son retard sur d’autres pays européens, les États-Unis et la Chine.■

Ill. Puits Cambefort à Firminy (France) Kid42, Wikimédia, Domaine public

[1] Carine Bernault. Open access et droit d’auteur. Larcier, 2016

Analyse de l’ouvrage

 

 

Via un article de Michèle Battisti, publié le 28 juillet 2017

©© a-brest, article sous licence creative common info