Data Mining et Loi sur le Numérique : une proposition de Sciences Communes

Comme je le signalais dans mon billet précédent, l’exception pour la fouille automatisée des texte et des données est l’une des principales omissions de la loi sur le numérique. Prévue dans une version “fuitée” en juillet dernier, elle a finalement été abandonnée (sans doute sous la pression du lobby de l’édition : c’est l’une de Némésis du pamphlet du président du Syndicat National de l’Édition Richard Malka).

Enfin, il ne faut jamais dire jamais. L’annonce officielle du projet de loi sur le numérique s’est accompagné du lancement d’un processus contributif inédit : la plate-forme République Numérique. J’ai publié tout à l’heure une nouvelle proposition intitulée 9.1 Exception pour l’extraction de textes et de données à des fins de recherche.

Comme la numérotation l’indique, il s’agirait d’une disposition complémentaire à l’article n°9 organisant le libre accès des publications scientifique. Le texte proposé est destiné à être ajouté à la liste des exception au droit d’auteur :

Les copies ou reproductions numériques réalisées à partir d’une source licite, en vue de l‘exploration de textes et de données à des fins de recherche, à l’exclusion de toute exploitation commerciale ou de toute republication, en dehors de courtes citations et d’éléments relevant du domaine public informationnel. Un décret fixe les conditions dans lesquelles l’exploration des textes et des données est mise en œuvre.

Ce texte reprend en grande partie la proposition initiale divulguée en juillet dernier. J’y ai ajouté les modifications et les précisions suivantes :

  • Les conditions de republication sont explicitées (puisque c’est clairement le point qui coince avec les ayant-droits). L’accès devrait être concrètement limité aux membres du projet de recherche, sans qu’il soit possible d’effectuer une diffusion plus large, en dehors d’éléments non protégés par le droit d’auteur (j’en ai profité pour invoquer la notion de domaine public informationnel qui apparaît dans un autre article de la Loi sur le Numérique).
  • L’exception n’est plus cantonnée à la seule recherche publique mais à la recherche en général. Il me semble que l’exclusion de l’exploitation commerciale suffit à discriminer la recherche privée à des fins pécuniaires. Seule reste le cas de la recherche bénévole qui devrait à mon avis être concernée par cette mesure (d’autant qu’en impliquant des Citizen Scientist, un projet comme ContentMine tend un peu à brouiller les frontières).
  • Je n’ai plus spécifié d’impératif de destruction des fichiers après utilisation. À partir du moment où on est dans le cadre d’un “fair use” déjà bien bordé, je ne suis pas certain que cela soit nécessaire.

Autant le dire franchement : dans l’immédiat, je n’attends pas grand chose de cet exercice. Je suis depuis déjà plusieurs années l’évolution des débats parlementaires sur des sujets liées aux nouveaux usages numériques. La seule conclusion que je tirerai de cette expérience accumulée, c’est qu’un nouveau dispositif légal ne s’impose généralement qu’à la longue (voire, à l’usure…). Des mesures essentielles comme la reconnaissance positive du domaine public ou l’élargissement de l’open data ont été fréquemment recalés, avant de commencer à se concrétiser. Elles ont fait leur chemin petit à petit : même les votes négatifs ont permis de conforter leur statut de sujet d’intérêt public. C’est tout ce que je peux souhaiter à l’exception pour le text and data mining…

Sciences communes

URL: http://scoms.hypotheses.org/
Via un article de Pierre-Carl Langlais, publié le 1er octobre 2015

©© a-brest, article sous licence creative common info