Trois mois après la formation de l’équipe en charge de créer le futur portail data.gouv.fr, un décret et une circulaire sortis au Journal Officiel ce matin viennent préciser le cadre dans lequel ÉtaLab et les ministères vont travailler.
Coup de frein à la marchandisation des données publiques
Le décret 2011-577 risque de ne pas faire plaisir à tous les intermédiaires qui vivent de la revente de données publiques sur le dos du travail des administrations. A partir du 1er juillet 2011, il sera beaucoup plus complexe pour une administration centrale de créer des barrières financières à l’accès à ses données publiques. Alors qu’elle pouvait jusqu’alors le faire sur simple initiative de son ministère de tutelle, elle devra désormais demander l’avis du Conseil d’orientation de l’édition publique et de l’information administrative (COEPIA) et la publication d’un décret dédié (donc après validation par les services du Premier ministre). Ce décret représente donc bien, comme le sous-entendait François Bancilhon de Data-Publica ce matin, un camouflet pour l’APIE qui milite depuis de longs mois pour la généralisation des licences payantes.
Cependant, s’il renforce le poids du Premier ministre dans l’arbitrage de la création de licences payantes, il réaffirme également celui du COEPIA. Créé en janvier 2010 pour plancher sur l’édition publique et l’information administrative, cet organisme à la composition controversée donne une large place aux industries privées de la vente de données publiques. La gouvernance de cet organisme est sans nul doute la plus grosse faiblesse du mécanisme introduit aujourd’hui par le Premier ministre. Si la volonté politique de limiter la mise à disposition payante est bien réelle, il faudrait doter le COEPIA de moyens de contre-balancer l’influence mercantile de ces acteurs privés.
Les données payantes le resteront au moins jusqu’en 2012
Une base de données papier
« I hope to get this on-line someday »CC-BY Farther Along
Les administrations qui pratiquent depuis longtemps la vente de leurs données conservent par ailleurs un délai de 13 mois pour recenser leurs licences payantes et les faire enregistrer, sans quoi ces licences deviendront caduques au 01 juillet 2012 et passeront sous le régime gratuit par défaut. Nul doute que l’IGN saura se saisir de cette opportunité pour poursuivre et entériner la politique de fermeture nationale en matière de données géographiques.
Enfin, ce mécanisme visant à assurer une meilleure transparence de la publication des données publiques, ne s’appliquera pas à tous les organismes ayant une mission publique. Les EPIC comme le BRGM ou les sociétés privées chargées d’une délégation de service public, comme les entreprises privées de transports en commun, pourront continuer à restreindre voire à faire payer l’accès aux données qu’elles produisent.
data.gouv.fr référencera-t-il également des données payantes ?
Si le décret publié aujourd’hui dissuade la création de données publiques payantes, il n’en annonce pas pour autant la fin. Ces dernières seront référencées sur un site unique. Les ventes controversées des base de données des prix du carburant ou des répertoires d’entreprises seront donc référencées publiquement sur un « site internet créé sous l’autorité du Premier Ministre ». Plus besoin donc d’en découvrir l’existence en épluchant le Journal Officiel ou les projets de lois.
Bien que la formule annonçant le recensement centralisé des données publiques payantes manque de clarté, elle semble tout de même indiquer que la mission ÉtaLab sera en charge de ce site. L’équipe de data.gouv.fr choisira-t-elle de créer un nouveau site ou va-t-elle mélanger les données « OpenData » (données publiques librement réutilisables) avec des données payantes, quitte à perdre en lisibilité ?
Une licence gratuite pour data.gouv.fr
À travers la circulaire publiée aujourd’hui, le Premier ministre recommande la mise à disposition gratuite de toute information publique, produite par un ministère ou un Établissement Public et Administratif, sous le régime d’une licence gratuite. Les termes de cette dernière doivent être rédigés par la mission ÉtaLab en concertation avec le COEPIA et l’APIE d’ici au 24 Août 2011 (3 mois). La circulaire leur demande pour cela de s’inspirer des « licences libres et gratuites » de ces mêmes organismes. L’effort sémantique est louable pour la forme mais son application semble plus que difficile puisque l’APIE n’a encore jamais produit de licence libre… Reste à croiser les doigts pour que les licences réellement libres, comme l’ODbL employée notamment à Paris ou au Maroc, soient également sources d’inspiration.
Outre cette licence supposée libre, le risque d’une démultiplication des licences reste malheureusement possible, car les administrations pourront élaborer avec l’APIE des licences gratuites spécifiques aux conditions variables (et en dernier recours payantes tout en cherchant à « favoriser l’innovation » sic…). Il conviendra de les surveiller attentivement au sein du futur catalogue de data.gouv.fr.
Des « correspondants données publiques » nommés dans chaque administration
Déjà apparus dans plusieurs ministères depuis quelques semaines, les correspondants données publiques sont officialisés via cette circulaire et devront tous être nommés sous 10 jours. Sous la responsabilité des secrétaires généraux, ces correspondants seront chargés de coordonner le travail d’identification, de recensement, de qualification (nom, source, date, version, mainteneur, licence d’origine, mots-clés) et de publication des données publiques. Ils seront également chargés d’assurer le suivi auprès des réutilisateurs des données de leur administration.
ÉtaLab publiera dans quelques semaines un guide technique à leur intention afin d’orienter leur travail en la matière.
Des formats de publication conseillés mais pas clairement définis
La circulaire s’attarde enfin sur la question des formats. Si cette partie présente l’avantage de catégoriser les types de fichiers à utiliser, elle se montre sans doute la plus décevante. Plutôt que de parler de formats ouverts, la circulaire cite des exemples d’extensions de fichiers numériques. Une extension de fichier dédiée aux tableurs (.ODS) est même malencontreusement citée dans la catégorie des « formats textes ». Il aurait sans doute été plus pertinent de citer le format décrivant ces fichiers : l’Open Document Format.
De plus, la circulaire cite également pour les tableurs l’extension .XLS, qui implémente un format propriétaire. Ce type de format pose de vrais problèmes de discrimination envers les utilisateurs. À tout moment, le propriétaire de ce format peut en restreindre l’utilisation ou intimider juridiquement les développeurs des applications en faisant usage.
Notons tout de même la recommandation d’employer des fichiers interopérables, notamment de type CSV, XML, KML ou encore RDF, formats ouverts que l’on espère voir largement favorisés par les administrations. On peut enfin relever une bonne nouvelle : celle de recommander à l’administration de prévoir dans ses prochains développements logiciels l’utilisation a minima de « formats interopérables ». Cela permettra d’éviter à certains ministères ou administrations d’être dans l’incapacité de maîtriser et exporter les données qu’ils produisent, comme c’est souvent le cas aujourd’hui.
La gratuité : un premier pas vers l’OpenData
La loi CADA consacre depuis de nombreuses années un droit d’accès et de ré-utilisation non-discriminatoire pour les données et informations publiques. En favorisant la gratuité, l’impulsion donnée aujourd’hui par les services du gouvernement va globalement dans le bon sens. Si les barrières financières sont les plus connues des restrictions, elles ne sont pas pour autant les seules : les freins juridiques, administratifs ou techniques sont bien réels et répandus.
Espérons que la mission ÉtaLab sera aussi attentive à ces autres éléments, par exemple en généralisant l’usage des formats ouverts et des licences réellement libres reconnues au niveau international.