L’opendata… Mon tour (rapide) des lieux.

Langage et développement
XML

| par Teddy Payet

Depuis le mois de novembre, je m’intéresse à la vague de l’Open Data en France. L’Open Data (une donnée ouverte), selon Wikipedia, est une information publique brute, qui a vocation à être librement accessible. La philosophie pratique de l’open data préconise une libre disponibilité pour tous et chacun, sans restriction de copyright, brevets ou d’autres mécanismes de contrôle.

Data.gouv.fr

Vous n’êtes certainement pas passé à côté de l’arrivée en ligne du site data.gouv.fr, le site officiel du gouvernement pour l’Open Data. Il a été réalisé par Etalab, une mission sous l’autorité du Premier Ministre chargée de l’ouverture des données publiques et du développement de la plateforme française. Ils ont réalisé plusieurs ateliers de travail autour de l’ouverture des données, constituant la charnière de data.gouv.fr.

Data.gouv.fr
http://data.gouv.fr

Ce site contient :
- 352 000 jeux de données publiques et plus ;
- 90 producteurs de données publiques ;

C’est pas mal comme chiffre, mais ce n’est qu’un début. Les données sont fragmentées par centre d’intérêts. Vous trouverez rarement de fichiers comprenant TOUTES les données d’une même thématique. Cela pourrait représenter un fichier de plusieurs milliers de ligne pour des données INSEE. Ce qui ne serait pas simple à l’utilisation par une machine (grosses ressources pour son exploitation).
Le plus gros soucis, en fait, n’est pas le nombre de lignes… Mais le format des fichiers. L’Open Data se veut ouvert. Pourtant, une très grande partie est dans un format fermé, propriétaire comme Excel. Voici, au 25 janvier 2012, la liste des formats présents sur le site :
- 293650 xls
- 2144 csv
- 216 txt
- 148 doc
- 117 shp
- 90 xml
- 50 pdf
- 44 Autre

Si vous additionnez tous ces chiffres, cela nous fait 296459 et non 352000 et plus… Peut-être une erreur dans leur calcul fichier par fichier. Cela dit :
99% des fichiers, ou jeux de données, sont au format XLS. Ce format peut s’expliquer sur le fait que c’est un format usuel. Qui n’a pas dans son administration Microsoft Office sur son poste ?
On peut comprendre ce choix. Mais il aurait été plus en adéquation avec la pensée de ce site de mettre une version CSV (Comma-separated values) de ces fichiers XLS.

Le vœux pieu est que ces données soient utilisables par des machines et créateur d’activités innovante sur l’exploitation des données.
L’idée me séduit énormément, pas par une envie mercantile, mais par le partage des informations au plus grand nombre. Cher à ma pensée.

Data.gouv.fr autrement

Si on parle de Data.gouv.fr, nous ne pouvons garder sous silence le site de debug de data.gouv.fr. Mais attention, ce n’est pas le gouvernement qui a mis ce dernier en place. Ce site est une initiative de Regards Citoyens. À l’heure actuelle, où j’écris ces quelques lignes, il n’existe pas encore de solution sur le site de data.gouv.fr pour signaler un problème de données ou technique lié à leur site.
“Regards Citoyens” est auteur de plusieurs actions dont celle-ci : Nos Données. Ce site vise à apporter plus de visibilité aux données publiques, l’Open Data, librement accessibles à tous.

Les initiatives locales

Autres que l’initiative gouvernementale, il existe des initiatives locales. Parmi elles, nous pouvons trouver :

Nod (Nantes ouverture des données)
http://data.nantes.fr/
Rennes Métropole en accès libre
http://www.data.rennes-metropole.fr/
Paris data
http://opendata.paris.fr/
Territoire Montpellier Numérique
http://opendata.montpelliernumerique.fr/
Portail OpenData - Communauté urbaine de Bordeaux
http://data.lacub.fr/
GrandToulouse.data
http://data.grandtoulouse.fr/
  • etc.

En plus de l’aspect graphique des sites, je trouve les données beaucoup plus accessible que le site du gouvernement.
Vous pourrez trouver une liste presque exhaustive des initiatives locales sur le site de LiberTIC grâce une carte géographique créée et mise à jour par leur soin : http://libertic.wordpress.com/2012/...
Petite anecdote : ce nom a un désavantage, voyez-le par vous même… Sans commentaire.]

Constat ou rêve inavoué

Toutes ces données viennent d’un bon souhait : la transparence de l’État et des collectivités.
Malheureusement, je constate un manque d’informations pratico-pratiques.

C’est bien de savoir qu’il y a eu tant de voix pour telle ou telle élection, sa répartition, que tel budget a été attribué pour tel projet de logement, d’aménagement urbain. Mais, il manque des informations pratiques :
- Les horaires des administrations ;
- La liste des entreprises d’une commune (les coordonnées, les heures, etc.) ;
- Les activités de la commune ;
- etc.

Leur utilité ? Développer des services au citoyen dans leur vie courante, augmenter l’activité économique d’une zone géographique. Informer les nouveaux arrivants dans une ville des infrastructures de la ville, les entreprises existantes, etc.
La porte est grande ouverte aux perspectives. A chacun de la saisir.

Et vous, qu’en pensez-vous ?