Ca y est data.gouv.fr est ouvert. Avec 352 000 jeux de données, il va falloir un peu de temps aux "data miners" pour trier le bon grain de l'ivraie !
Pour ceux qui s'intéressent aux données "transports publics" uniquement voici quelques jeux intéressants :
Pour ceux qui s'intéressent aux données "transports publics" uniquement voici quelques jeux intéressants :
- les gares voyageurs du Réseau Ferré National par la SNCF,
- toutes les gares du Réseau Ferré National par RFF, qui diffèrent des précédentes car elles intègrent les gares désaffectée et les gares fret notamment,
- les 18 000 passages à niveau proposés par RFF,
- le périmètre (en nom des communes) des 372 PTU (plans de transports urbains) français,
- on a aussi des données horaires sur la commune de Longjumeau et des lignes et points d'arrêt du département du Loir et Cher...
- plus de données : l'état de l'art en matière d'open data dans les transports est la publication des horaires (à Rennes, ou Bordeaux), voire des passages en temps réel (à Londres),
- une couverture géographique plus large,
- une action sur les formats. Si la publication d'horaires sous Excel se généralise, il faudra un effort considérable pour les utiliser à grande échelle, compte tenu de la diversité des fiches et de la difficulté pour un ordinateur de les interpréter automatiquement.
Sur ce dernier point, la question n'est pas simple. La posture actuelle d'EtatLab répond à la demande "Raw Data Now" de Tim Berners Lee. Si Etalab se concentre sur les actions 1 et 2, peut être que des tiers prendront progressivement 3 en compte. Ce pourrait, par exemple être un rôle naturel pour l'Afimb...
Mais la situation se complique car si tout le monde s'accorde pour recommander des formats standards et ouverts ! certains prônent la publication des données d'offre au format "Trident", d'autres, (j'ai de la sympathie pour eux) souhaitent utiliser GTFS un format bien documenté et répandu, certains, plus rares, voudraient des web services. Enfin, un nombre croissant d'acteurs parle de RDF, de données liées et de web sémantique.
J'avais, en 2010, publié une série de 4 articles très simples (simplistes ?) sur ces questions de données. Plus récemment, un certain Bill Roberts qui travaille chez Swirrl a publié, sur le Data Hub du ckan, les données d'offre du Grand Manchester au format RDF. C'est à ma connaissance l'initiative la plus avancée en la matière...
Sur ces sujets je suis très intéressé par vos avis ou vos propositions.
Cela m'amène à une autre nouvelle en matière d'Open Data Transport, l'ouverture, peut de temps après data.gouv.fr de data.sncf.com. Ce n'est pour l'instant qu'une plateforme de débat sur laquelle, justement, les questions évoquées précédemment sont abordées, par exemple ici et là. Si vous avez un avis, participez !
Cela m'amène à une autre nouvelle en matière d'Open Data Transport, l'ouverture, peut de temps après data.gouv.fr de data.sncf.com. Ce n'est pour l'instant qu'une plateforme de débat sur laquelle, justement, les questions évoquées précédemment sont abordées, par exemple ici et là. Si vous avez un avis, participez !
Aucun commentaire:
Enregistrer un commentaire