Les universités françaises et l’Open Data après la loi numérique

Ce billet est le second d’une série de trois que je vais publier sur ce blog cette semaine pour examiner les répercussions de la loi « République numérique » sur le secteur de l’enseignement supérieur et de la recherche. Après un premier billet publié lundi à propos de l’impact de la loi en matière d’Open Access, je vais à présent me pencher sur le volet « Open Data » et la façon dont il va affecter les universités. Ce n’est pas l’aspect qui a été le plus commenté jusqu’à présent, mais vous allez voir que les changements à attendre pour ces établissements sont substantiels par rapport à la situation antérieure.

opendata
Image par Auregann. CC-BY-SA. Source : Wikimedia Commons.

Pour saisir complètement la portée de cette réforme, il faut prendre en considération, outre la loi « République numérique », la loi du 28 décembre 2015 relative à la gratuité et aux modalités de la réutilisation des informations du secteur public (dite aussi « loi Valter »), ainsi que son décret d’application paru en juillet dernier.

Je colle ci-dessous une présentation qui résume les grandes lignes de la question que je vais développer dans le billet par la suite.

Fin du régime dérogatoire des établissements d’enseignement supérieur et de recherche

Pour comprendre ce qui va changer pour les universités en matière d’ouverture des informations publiques qu’elles produisent, il faut remonter un peu en arrière et rappeler le cadre juridique qui leur était applicable avant l’entrée en vigueur de la loi numérique.

En 2005, la loi CADA (relative à l’accès aux documents administratifs) a été modifiée de manière à consacrer un principe de libre réutilisation des informations publiques des administrations. Néanmoins, la portée de cette règle était assez limitée, car si les administrations ne pouvaient en théorie refuser de faire droit à une demande de réutilisation de leurs données, elles n’étaient pas obligées de les mettre en ligne de manière pro-active et elles avaient aussi la possibilité de rendre la réutilisation payante par le biais de redevances.

A partir de 2011, un mouvement en faveur de l’Open Data a commencé à se dessiner en France, au niveau des administrations centrales, qui ont été obligées par le biais de décrets de mettre en ligne sur la plateforme data.gouv.fr un nombre croissant de jeux de données en les plaçant sous la Licence Ouverte / Open Licence (laquelle autorise la libre réutilisation y compris à des fins commerciales, à la condition de citer la source des données). Les ministères ont été les premières entités concernées par cette nouvelle politique et celui de l’Enseignement Supérieur et de la Recherche a publié à ce jour 55 jeux de données en Open Data.

Cependant les universités et les établissements de recherche sont restés de leur côté en dehors de ce mouvement d’Open Data, dans la mesure où ces administrations bénéficiaient d’un régime dérogatoire dans la loi CADA. Le texte comportait en effet un article 11 contenant les dispositions suivantes :

Par dérogation au présent chapitre, les conditions dans lesquelles les informations peuvent être utilisées sont fixées, le cas échéant, par les administrations […] lorsqu’elles figurent dans des documents produits ou reçus par :

a) des établissements et institutions d’enseignement et de recherche ;

b) des établissements, organismes ou services culturels.

Cet article signifiait que les établissements bénéficiaires (universités et institutions de recherche, mais aussi côté culture, bibliothèques, archives et musées) restaient libre de déterminer les conditions de réutilisation des informations qu’ils produisaient, et donc (pour simplifier) de ne pas autoriser les réutilisations. Cette forme de « privilège » a fait que ces administrations n’ont pas été concernées par les décrets de 2011 ayant initié la politique d’Open Data en France. Pour être exact, il ne leur était pas interdit d’ouvrir leurs données dans le cadre d’une politique d’Open Data, mais elles n’y étaient pas obligées et elles gardaient entièrement la faculté de déterminer quels jeux elles souhaitaient rendre librement réutilisables.

C’est précisément sur ce point que la loi « République numérique » va avoir un fort impact sur les universités, dans la mesure où le régime dérogatoire dont bénéficiaient les établissements d’enseignement supérieur et de recherche est supprimé. Ces derniers seront à présent intégrés au principe « d’Open Data par défaut » instauré par ce texte et qui en constitue une des principales innovations.

Les universités dorénavant incluses dans le principe « d’Open Data par défaut »

Pour comprendre en quoi consiste ce principe d’Open Data par défaut, il faut se reporter à l’article 6 de la loi « République numérique » :

Sous réserve des articles L. 311-5 et L. 311-6 et lorsque ces documents sont disponibles sous forme électronique, les administrations mentionnées au premier alinéa de l’article L. 300-2, à l’exception des personnes morales dont le nombre d’agents ou de salariés est inférieur à un seuil fixé par décret, publient en ligne les documents administratifs suivants :
« 1° Les documents qu’elles communiquent en application des procédures prévues au présent titre, ainsi que leurs versions mises à jour ;
« 2° Les documents qui figurent dans le répertoire mentionné au premier alinéa de l’article L. 322-6 ;
« 3° Les bases de données, mises à jour de façon régulière, qu’elles produisent ou qu’elles reçoivent et qui ne font pas l’objet d’une diffusion publique par ailleurs ;
« 4° Les données, mises à jour de façon régulière, dont la publication présente un intérêt économique, social, sanitaire ou environnemental.

Contrairement à la situation antérieure, les administrations (sauf quelques exceptions maintenues notamment par la loi Valter) sont désormais obligées de publier en ligne et de rendre réutilisables un large ensemble de jeux de données, dont l’article 6 définit plusieurs catégories. Et la nouveauté, c’est que les universités ne bénéficient plus à présent d’un régime dérogatoire qui leur permettraient de se soustraire à cette obligation d’ouverture des informations publiques. Celui a été en effet explicitement supprimé par la loi Valter en octobre 2015.

Parmi la liste figurant à l’article 6, on trouve notamment les « bases de données, mises à jour de façon régulière, qu’elles produisent ou qu’elles reçoivent […] ». Cela concerne notamment les bases de données composant le système d’information de l’administration centrale des universités, qui leur servent à gérer des aspects comme le budget, le personnel, leurs bâtiments et les flux associés, les formations dispensées ou les activités de recherche des laboratoires rattachés à l’établissement.

Le texte impose aussi (alinéa 2) la mise en ligne des documents listés dans un Répertoire des Informations Publiques (RIP), qu’en vertu de l’ancien article 17 de la loi CADA, toutes les administrations sont tenues de mettre en place. Le RIP consiste en un registre mis à disposition des usagers dans lequel figure la liste des « principaux documents » comportant les informations produites par l’établissement. A ma connaissance, aucune université française n’a encore rempli cette obligation légale de mise en place d’un RIP (ce qui pourrait leur être reproché), mais avec la loi numérique, elles seront aussi tenues de rendre réutilisables les documents qu’elles y feront figurer.

La loi numérique est plus floue lorsqu’elle évoque l’obligation de mise en ligne des « données, mises à jour de façon régulière, dont la publication présente un intérêt économique, social, sanitaire ou environnemental« . Les universités garderont ici une marge de manoeuvre pour déterminer quelles informations parmi celles qu’elles produisent présentent un tel intérêt. Mais elles ne pourront cependant pas faire l’économie d’une démarche d’inventaire des jeux qu’elles détiennent et d’une sélection en vue d’une diffusion ouverte. L’idéal serait d’ailleurs que les universités se concertent entre elles pour libérer des jeux similaires.

A noter d’ailleurs qu’un mécanisme « d’Open Data à la demande » a été instauré par la loi république numérique, qui permettra assez facilement de forcer la mise en ligne de jeux de données au cas où une université ne procéderait pas d’elle-même à sa diffusion. L’alinéa 1 de l’article 6 indique en effet que les administrations doivent mettre en ligne « les documents qu’elles communiquent en application des procédures prévues au présent titre« . Cela signifie que les administrations seront obligées de mettre en ligne les documents qui leurs sont demandés par les usagers dans le cadre d’une procédure CADA d’accès aux documents administratifs. Si un document entre dans le périmètre (somme toute assez large) de cette loi, alors l’université ne pourra s’opposer à la communication (sous peine d’un recours à la CADA) et lorsque le document est communiqué, l’administration devra ensuite le mettre en ligne et rendre réutilisable les informations qu’il contient. Tout ceci fait que si une université fait preuve d’inertie dans la mise à disposition de données couvertes par l’article 6, il suffira qu’un citoyen, une association ou même une entreprise en fassent la demande auprès d’elle pour qu’elle soit obligée de les mettre en ligne.

On le voit ce principe « d’Open Data par défaut » est relativement puissant, et s’il n’est pas sans limite, il va sans doute produire des changements considérables dans la manière dont les universités diffusent les documents et les données qu’elles produisent.

Quelles limites à la réutilisation des données des universités ?

Le principe d’Open Data par défaut de la loi « République numérique » a beau être large, il n’est cependant pas sans limite. La première concerne l’impératif de protection des données personnelles et de la vie privée, qui devra naturellement continuer à être respecté et sur lequelle l’article 6 de la loi met l’accent :

Sauf dispositions législatives contraires ou si les personnes intéressées ont donné leur accord, lorsque les documents et les données mentionnés aux articles L. 312-1 ou L. 312-1-1 comportent des données à caractère personnel, ils ne peuvent être rendus publics qu’après avoir fait l’objet d’un traitement permettant de rendre impossible l’identification de ces personnes. Une liste des catégories de documents pouvant être rendus publics sans avoir fait l’objet du traitement susmentionné est fixée par décret pris après avis motivé et publié de la Commission nationale de l’informatique et des libertés.

Ce passage signifie que si des informations correspondent à des données à caractère personnel, alors les administrations ne doivent pas les mettre en ligne et les rendre réutilisables, à moins de rendre impossible l’identification des personnes concernées ou après avoir obtenu leur consentement. On notera qu’il ne suffit pas simplement d’anonymiser les données, mais de « rendre impossible l’identification des personnes« , ce qui va plus loin (notamment pour empêcher les identifications par recoupements de données).

Cet aspect risque d’être très compliqué à gérer pour les administrations en général et pour les universités en particulier. Car les établissements vont se retrouver pris entre deux exigences contradictoires : d’une part une soumission au principe d’Open Data par défaut, qui implique la publication de nombreux documents et jeux de données ; d’autre part l’impératif de protection des données personnelles qui reste toujours aussi fort. Pour prendre un exemple concret, une université sera dorénavant obligée de mettre en ligne les informations relatives au personnel qu’elle emploie ou aux étudiants inscrits, mais à la condition d’anonymiser ces données et de rendre impossible l’identification par recoupement, ce qui peut s’avérer très complexe à réaliser. La CNIL a annoncé qu’elle préparait un « pack de conformité » à destination des acteurs publics pour la mise en oeuvre de la loi République numérique et on attend à présent avec impatience ce document qui permettra sans doute d’y voir plus clair sur la manière de jongler avec ces exigences contradictoires.

Une autre limitation au principe d’Open Data par défaut concerne la protection des droits de propriété intellectuelle détenus par des tiers à l’administration. L’article L. 321-2 du Code des relations entre le public et les administrations prévoit ainsi que :

Ne sont pas considérées comme des informations publiques […] les informations contenues dans des documents […] sur lesquels des tiers détiennent des droits de propriété intellectuelle.

Dans le contexte d’établissements comme des universités, de nombreux documents couverts par des droits de propriété intellectuelle sont produits, que l’on songe par exemple aux cours et aux publications des enseignants-chercheurs, aux diverses productions des étudiants (copies d’examen, travaux, mémoires, etc), aux ressources pédagogiques à distance, etc. Tous ces contenus sont naturellement exclus du périmètre des documents soumis à l’obligation de mise en ligne définie à l’article 6 de la loi. Pour ce qui concerne le cas spécifique des publications des chercheurs, il est traité à l’article 30 de la loi, à travers les dispositions de faveur de l’Open Access dont j’ai parlé dans un précédent billet, mais le principe demeure que les chercheurs restent pleinement titulaires du droit d’auteur sur leurs productions et sont à ce titre libres de décider s’ils souhaitent les publier en ligne ou non.

A propos de cette question de l’articulation entre l’Open Data et les droits de propriété intellectuelle, il faut noter que la loi « République numérique » a cependant apporté une clarification importante relative au droit des bases de données des administrations. Il était arrivé dans le passé que des administrations (notamment des services d’archives) opposent leur droit de producteur de base de données à une demande de réutilisation. Après quelques flottements, la jurisprudence administrative avait fini par leur donner raison, ce qui signifiait que ces établissements pouvaient neutraliser le principe de libre réutilisation des informations publiques en s’appuyant sur le droit des bases de données. Or la loi numérique contient un article 11 qui va complètement changer la donne en la matière :

Sous réserve de droits de propriété intellectuelle détenus par des tiers, les droits des administrations mentionnées au premier alinéa de l’article L. 300-2 du présent code, au titre des articles L. 342-1 et L. 342-2 du code de la propriété intellectuelle, ne peuvent faire obstacle à la réutilisation du contenu des bases de données que ces administrations publient en application du 3° de l’article L. 312-1-1 du présent code.

Cette phrase signifie que les administrations ne peuvent dorénavant plus opposer un droit de producteur de base de données à une demande de réutilisation des informations publiques qu’elles détiennent, et cela s’appliquera aux universités comme aux autres.

Quid de la faculté à fixer des redevances de réutilisation ?

Contrairement à la situation qui prévalait antérieurement dans laquelle les administrations pouvaient discrétionnairement mettre en place des redevances pour la réutilisation de leurs données, la loi Valter a consacré un principe général de gratuité. L’article 15 de la loi prévoit néanmoins une dérogation possible à titre exceptionnel pour les administrations dont le financement est substantiellement assuré par des ressources propres :

La réutilisation d’informations publiques est gratuite. Toutefois, les administrations mentionnées à l’article 1er peuvent établir une redevance de réutilisation lorsqu’elles sont tenues de couvrir par des recettes propres une part substantielle des coûts liés à l’accomplissement de leurs missions de service public.

Un doute pourrait poindre ici à propos des universités, car il s’agit typiquement d’établissements auxquels il est demandé de dégager des ressources propres pour assurer une part d’auto-financement. Néanmoins, le décret d’application de la loi Valter, paru en juillet dernier, a clairement défini un seuil minimal de 25% de ressources propres en dessous duquel les administrations ne sont plus autorisées à exiger des redevances de réutilisation :

Sont seuls autorisés à établir des redevances de réutilisation en application de l’article L. 324-1 les services de l’Etat et les autres personnes mentionnées à l’article L. 300-2 dont l’activité principale consiste en la collecte, la production, la mise à disposition ou la diffusion d’informations publiques, lorsque la couverture des coûts liés à cette activité principale est assurée à moins de 75 % par des recettes fiscales, des dotations ou des subventions.

Or si l’on en croit ces chiffres tirés de l’Observatoire KPMG 2015 des Universités et des Ecoles, les universités en France dégagent en moyenne 18% de ressources propres, ce qui les placent en dessous du seuil fixé par le décret de la loi Valter.

ressources

Ceci étant dit, on pourrait imaginer qu’une université arrive à dépasser ce seuil des 25% et l’étude KPMG précité indique que les Ecoles et Instituts de recherche atteignent en moyenne plutôt des taux d’autofinancement de 32%. Néanmoins, cela ne permettra toujours pas à ces établissements de recherche de lever des redevances de réutilisation sur la réutilisation de leurs données.

Car le décret de la loi Valter précise bien que seuls disposent de cette faculté les administrations dont « l’activité principale consiste en la collecte, la production, la mise à disposition ou la diffusion d’informations publiques » et il faut par ailleurs que les subventions qui leur sont versées servent directement à couvrir les coûts de cette activité principale liée aux données. Or ce n’est pas le cas des universités et établissements de recherche, dont les missions sont bien plus larges que la seule production d’informations publiques.

On en déduit donc que les universités sont strictement astreintes au respect du principe de gratuité et qu’elles ne pourront plus établir de redevances de réutilisation des données, sous peine de se mettre dans l’illégalité.

Conclusion : les universités françaises doivent à présent passer à l’Open Data

On le voit, la loi « République numérique » va avoir un impact important sur les universités en les soumettant, comme les autres administrations au principe d’Open Data par défaut qu’elle instaure. C’est la fin d’une situation dérogatoire qui s’appliquait aux universités et établissements de recherche dans la législation antérieure. Cela signifie qu’un grand nombre de documents et de jeux de données devront être mis en ligne dans les années à venir par les universités, ce qui implique des défis organisationnels non négligeables à surmonter. Il me semble d’ailleurs que les conséquences de ce texte n’ont pas été assez clairement perçus par ces acteurs, qui se sont beaucoup focalisés sur le volet Open Access de la loi sans voir que la partie Open Data les concernait également.

La loi fixe aux administrations plusieurs délais (de 6 mois à deux ans selon les catégories de données) pour se conformer à ces nouvelles obligations, échéances qui vont arriver très rapidement à présent. Il faut cependant noter qu’un décret est encore attendu qui va fixer un seuil d’agents au-delà duquel une administration sera soumise au principe d’Open Data par défaut. Mais les universités étant généralement des établissements employant un nombre conséquent d’employés, il serait surprenant qu’elles ne soient pas comprises dans les administrations concernées.

Dans ce billet, j’ai surtout insisté sur les données produites par les universités en tant qu’établissement administratif. Ce sont les informations produites par les services centraux et les services communs de ces établissements qui sont au premier chef concernées par le passage en Open Data (y compris d’ailleurs celles des Services Communs de la Documentation, c’est-à-dire les bibliothèques universitaires). Néanmoins, une autre question importante est de savoir si les données de la recherche, en tant que telles, sont comprises ou non dans ce principe d’Open Data par défaut. Au cas où la réponse serait positive, cela signifie qu’il y aurait également obligation de les mettre en ligne et de les rendre réutilisables, moyennant la protection des données personnelles.

C’est une interrogation à laquelle j’essaierai de répondre dans le troisième billet de cette série consacrée aux répercussions de la loi numérique sur le secteur de l’enseignement supérieur et de la recherche. J’y étudierai la manière dont le texte met en place un nouveau « statut » des données de la recherche.

En attendant, les commentaires sont ouverts si vous souhaitez poser des questions ou laisser des observations à propos de ce nouveau tournant de l’Open Data qui attend les universités.


Classé dans :Données publiques et Open Data Tagged : données personnelles, informations publiques, open data, réutilisation, recherche, Universités

Via un article de calimaq, publié le 10 décembre 2016

©© a-brest, article sous licence creative common info