Comment libérer des données publiques, concrètement ?

Le canton de Bourg-de-Péage et du pays de Romans ont récemment édités un intéressant Guide de la vente directe, de la ferme à l’assiette (.pdf), qui présente et répertorie quelques 91 producteurs locaux de fruits, légumes, viande, etc. qui proposent des modalités de vente directe.

Un article repris du blog d’Hubert Guillaud "Le Romanais" avec l’autorisation de l’auteur

Ce guide référence de très nombreux producteurs locaux, mais pas tous, et en les limitant à une circonscription administrative précise, qui ne correspond pas à nos bassins de vie, c’est-à-dire à la manière dont nous circulons sur le territoire. Le format sous lequel il est présenté, de surcroit, ne correspond pas vraiment, pour ma part, à la façon dont j’ai besoin de consulter ces informations : pour ma part, j’ai plutôt besoin d’une carte, avec des données que je puisse récupérer pour les agréger à mes propres cartes… Sur le site de l’Office de tourisme de Romans-Bourg-de-Péage, vous avez accès, via la cartographie, à l’ensemble de ces producteurs locaux, répertoriés sur une carte. Mais vous ne pouvez pas ajouter d’entrée, ni télécharger les données, ni agréger ces données à vos propres cartes. Et le moteur de recherche associé ne pointe pas sur la carte, mais uniquement sur les documents bruts du site : impossible par exemple d’accéder directement à une fiche ou à la carte en faisant une recherche.

La base de donnée des producteurs locaux devrait être libre et accessible aux citoyens comme bon leur semble. J’ai donc décidé, unilatéralement, de la libérer. Je suis persuadé qu’elle devrait intéresser de nombreux sites : sites de maisons de quartiers souhaitant promouvoir la production locale et pouvant donner accès autrement à une liste de producteurs locaux (les trois maisons de quartier de Romans proposent toutes des paniers d’Amap locales), sites d’écoles d’agriculture (Lycée horticole de Romans, MFR de Mondy et leurs nombreux sites satellites, comme l’excellent Un monde allant Vert) souhaitant utiliser ces données pour les mixer aux leurs et les compléter, sites de ces mêmes producteurs locaux, qu’ils soient référencés par les producteurs du coin ou de Ferme en Ferme ou pas (comme c’est le cas de la plupart des producteurs, qui ne sont pas référencés dans ces bases, ni toujours sur les PagesJaunes et qu’on trouve souvent au détour d’un panneau sur les routes qu’on parcours), simples citoyens désireux de contribuer à l’amélioration de ces données, au-delà de limites administratives fictives qui nous sont proposées, etc.

Comment faire ?

J’ai donc passé ce guide en tableur en utilisant Google Docs et notamment GoogleForm et GoogleSpreadsheet, les applications de Google permettant de créer très facilement des Formulaires en ligne et des bases de données.

Restait, une fois les données récupérées (via un simple mais patient copié-collé d’information – et oui, l’extraction de données publiques, c’est d’abord du copié-collé !), à géolocaliser les adresses. Et si cela peut être simple quand on a des données clairement référencées (avec des identités, des numéros, des noms de rues, un code postal précis), force est de constater qu’il est bien plus dur de géoréférencer des adresses en milieu rural où le quartier, le lieu dit, voir la seule identité du producteur fait office d’adresse. Les outils utilisables pour faire ce travail (comme BatchGeocode ou Click2Map – merci Loïc Haÿ et son WidgetOLab) produisent bien souvent des approximations. Cependant, ils ont également un avantage : celui de vous montrer les erreurs que vous avez fait dans la collecte des données.

Pour ma part, j’ai ajouté déjà 5 fiches au document originel : notamment celle du producteur de Pommes, pêches, cerises et abricots où je me fournis quasiment chaque semaine et qui n’était pas dans le guide. Et celles de quelques autres, qui n’entrent pas dans les limites administratives du guide, mais chez lesquels il nous arrive de passer (il n’y a que les administrations pour penser leurs limites avec des frontières étanches). Et je suis persuadé qu’il y en a encore beaucoup d’autres, qui ne sont pas indiquées dans les guides…

Ce qui est libéré !

Vous pouvez accéder au formulaire pour compléter le référencement. Voici le moteur de recherche qui permet de regarder si le producteur que vous souhaitez ajouté y est déjà. Et voici la base de donnée que vous pouvez réutiliser comme bon vous semble (disponible en de multiples formats .csv, Excel et OpenDocument si vous utilisez OpenOffice. La base est même disponible au format RSS pour surveiller les ajouts). Depuis la carte générée par BatchGeoCode (tout en bas de la page), on peut produire un fichier .kml que vous pouvez ensuite déverser dans n’importe quel outil générant de la cartographie Umapper par exemple ou Google Maps…).

Tout ça pour quoi ?

Tout ça pour mieux comprendre, concrètement, à ma modeste échelle, sans être programmeur, ni utiliser des outils de récupération de données évolués, ce vaste discours sur la libération des données publiques – duquel je participe. J’ai voulu, volontairement, prendre un exemple concret, précis, et voir ce qu’il était possible de faire.

On peut imaginer faire cela sur bien d’autres répertoires de données, à la manière de ce que font les gouvernements britanniques ou américains, ou ce que font des collectifs français comme Regards Citoyens.

Ce petit exemple montre en tout cas que l’exploration pratique dans les territoires n’est pas si simple. Que l’accès aux données (à des données fraiches, datées, à jour, complètes…) est compliqué. Et qu’il est même difficile d’imaginer ce qu’on peut en faire, concrètement. Comme le soulignait Benoït Thieulin de la Netscouade lors de l’Open Data Camp de janvier dernier : quelles sont les données qui sont exploitables ou disponibles dans de multiples autres domaines que le tourisme ou le transport, qui sont souvent les secteurs les plus structurés par les données ? Quelles données environnementales les services de la ville ou du département amassent ou pourraient donner accès ? Quelles données économiques (notamment sur l’emploi) sont accessibles et seraient libérables ? Quelles données d’exploitation de services publics pourraient donner naissance à des applications « décisives » ?

On le voit en tout cas, localement, l’enjeu est de donner accès à des petits répertoires de données bien souvent, qui peuvent permettre à d’autres acteurs locaux de gagner du temps. Qui mis bout à bout peuvent prendre du sens. Hormis les données récoltées automatiquement, beaucoup auront besoin d’embarquer les citoyens pour les améliorer et les rendre plus utilisables : car sans leurs enrichissements, finalement, ces données libérées n’auront bien souvent que peu d’impacts…

Reste encore à les rendre utilisables par tous… Et on devine que là ce n’est pas aussi simple qu’on voudrait le croire…

On voit bien qu’il ne suffira pas d’en parler, et les bons exemples d’OpenStreetMap ne suffisent pas (la cartographie libre et collaborative, qui seule permet d’avoir des données précises d’accessibilité sur une ville par exemple, car les données d’OSM peuvent être corrigées par les gens, là où celles de GoogleMaps ne peuvent pas l’être : par exemple, la rue du 19 mars 1962 à Pizançon est accessible dans les 2 sens sur OSM (ce qui est le cas) alors que sur GoogleMaps elle est faussement indiquée en sens unique). La libération des données publiques, même au niveau local reste encore un chantier…

Posté le 14 mars 2010

licence de l’article : Contacter l’auteur