Text & Data Mining dans la loi numérique issue de la CMP : un grand progrès, mais non sans limites

Le collectif SavoirsCom1 salue l’adoption en commission mixte paritaire d’une exception de TDM qui sera inscrite dans le Code de la Propriété Intellectuelle.

Safety comes first

Article 18 bis
Le code de la propriété intellectuelle est ainsi modifié :
1° Après le 9° de l’article L. 122-5, il est inséré un 10° ainsi rédigé :
« 10° Les copies ou reproductions numériques réalisées à partir d’une source licite, en vue de l’exploration de textes et de données incluses ou associées aux écrits scientifiques pour les besoins de la recherche publique, à l’exclusion de toute finalité commerciale. Un décret fixe les conditions dans lesquelles l’exploration des textes et des données est mise en oeuvre, ainsi que les modalités de conservation et de communication des fichiers produits au terme des activités de recherche pour lesquelles elles ont été produites ; ces fichiers constituent des données de la recherche ; »
2° Après le 4° de l’article L. 342-3, il est inséré un 5° ainsi rédigé :
« 5° Les copies ou reproductions numériques de la base réalisées par une personne qui y a licitement accès, en vue de fouilles de textes et de données incluses ou associées aux écrits scientifiques dans un cadre de recherche, à l’exclusion de toute finalité commerciale. La conservation et la communication des copies techniques issues des traitements, au terme des activités de recherche pour lesquelles elles ont été produites, sont assurées par des organismes désignés par décret. Les autres copies ou reproductions sont détruites. »

Le nouvel article, très proche dans sa formulation de celui qui avait été adopté en première lecture par les députés en janvier, représente une avancée importante. Comme en Grande-Bretagne en 2014, le texte crée une exception au droit d’auteur, sans attendre que la directive « Infosoc » de 2001 soit révisée de façon à ne plus proposer une liste fermée d’exceptions.

Le collectif SavoirsCom1 s’interroge, cependant, sur le périmètre exact de l’exception. Pourquoi avoir limité le data mining aux seules données « incluses ou associées aux écrits scientifiques » ? Pourquoi une telle limitation nécessairement contre-productive dans la mesure où les activités de TDM ne se limitent pas uniquement aux données de la recherche ? On songe notamment aux données circulant directement sur Internet, pour lesquelles la fouille automatisée constituerait une méthode adéquate d’exploration. Pourquoi un tel traitement différencié entre texte et données, alors que tous deux sont la même forme binaire une fois numérisés ?

Cette restriction est d’autant plus incompréhensible que l’article 17 de la loi précise que la réutilisation des données de recherche financées par des fonds publics est « libre » dès lors qu’elles sont publiées volontairement par des chercheurs. Il n’était donc pas nécessaire d’ajouter une restriction à l’article 18 bis, qui va causer des problèmes d’interprétation.

Pour une analyse plus détaillée de la portée de ces dispositions, vous pouvez consulter ce billet sur le blog Numeribib.

Crédits photo : Hard Hats. Par b3d_. Mise à disposition selon les termes de la licence CC-BY 2.0. Source : Flickr.

Via un article de SavoirsCom1, publié le 5 juillet 2016

©© a-brest, article sous licence creative common info