Les premiers jeux de données ouverts témoignaient, parfois, d'un manque de connaissance sur les mécanismes basiques de la réutilisation. Ces maladresses sont, en général, rapidement repérées et parfois corrigées par les "ré-utilisateurs" dès que les données sont publiées. C'est un des premiers bénéfices de l'Open Data car ces "petits défauts" sont , en réalité, coûteux. Ils témoignent d'un manque de maîtrise des données et d'efficacité dans les processus internes à l'entreprise.
En voici deux exemples concrets :
En voici deux exemples concrets :
- La mise en forme des données est, souvent faite avec beaucoup de soin. Il s'agit de faciliter l'interprétation des données pour des lecteurs pressés. Cette interprétation "par défaut", constitue, souvent involontairement, un obstacle à la réutilisation et à la réutilisation automatisée en particulier. Les fichiers orientés "visualisation" : pdf, fichiers issus des suites bureautiques Microsoft, ou de logiciels de création graphique... si pratiques pour présenter des données à un auditoire d'humains, ne se prêtent pas toujours à une utilisation directe par une machine. Simon Chignard évoque ce sujet avec un exemple précis dans données brutes ou données contextualisées. A l'inverse, des tableaux type "base de données" listant simplement un objet par ligne et une valeur décrivant l'objet par colonne permettent de faire abstraction de toute mise en forme. La réutilisation est alors facilitée même lorsque le "parti pris" du ré-utilisateur n'est pas celui de l'éditeur. Des formats de données type xml, csv, json sont particulièrement adaptés à la réutilisation parce qu'ils interdisent la "mise en forme". On gagne en ré-utilisabilité ce qui est perdu en lisibilité ! et on s'achemine vers la généralisation des API au sein de l'entreprise... Mais c'est un sujet dont on reparlera !
- La production de versions régulièrement actualisées d'un fichier ou la production de plusieurs fichiers complémentaires sur un même thème est un cas d'usage fréquent en entreprise. Pour relier les grandeurs concernant un même objet dans les différents fichiers il est nécessaire de recourir à un identifiant... Et là les choses peuvent se compliquer ! Un exemple classique dans le domaine du transport est celui des gares ou des arrêts. Le nom des arrêts ne constitue, en effet rarement, un identifiant stable. En pratique le nom pourra-t-être écrit en majuscule, en minuscule, avec ou sans abréviation (CDG, St Lazare, F. Mitterrand...). Le recours a un identifiant numérique univoque (si possible un code numérique) est loin d'être systématique. Il est pourtant nécessaire pour une réutilisation automatique rapide.
La culture des données ne se limite pas à ces deux exemples un peu triviaux. Sans aller jusqu'à la "big data", une réflexion modeste et pratique sur les outils et les processus de traitement des données dans l'entreprise peut apporter des gains importants. C'est ce qu'explique brillamment Matti Keltanen dans The Guardian.
Les hackathons, internes et externes et autres labs peuvent être de véritables catalyseurs pour la culture de la donnée en sensibilisant les acteurs par l'expérimentation.
Une certaine considération managériale pour l'analyse quantitative dans les décisions d'entreprise est cohérente avec le développement de la culture de la donnée et est, évidemment, susceptible d'en favoriser la diffusion. Cela n'est pas acquis dans les entreprises qui valorisent parfois l'analyse qualitative voire l'intuition, ou "l'opinion des personnes dont le salaire est élevé" (les fameuses "Highly Paid Person Opinions" évoquées dans cet article Votre entreprise est elle plutôt Data ou Hippo ?) .
L'Open Data Institute britannique fait de la promotion de la data culture un objectif de premier plan. Le mécénat d’œuvres artistiques utilisant des données est un des moyens utilisés.
Cela donne un air un peu excentrique à l'open space de l'ODI. On y trouve par exemple ce distributeur qui libère ses produits lorsque le mot "recession" est utilisé sur la BBC (une oeuvre particulièrement coûteuse en ce moment) ou cette "metrography" de Benedikt Groß & Bertrand Clerc qui distord une carte pour la faire correspondre au plan du métro de Londres.
Dans un registre similaire, mais plus démocratique, les agitateurs de La Fonderie avaient réalisé l'Expoviz en 2012 dont le site mérite le détour et une exploration approfondie.
Alors, quels sont, pour vous, les moyens de développer la culture des données dans nos entreprises et administrations ? est ce un enjeux ?
Cet article fait partie d'une série "post open data" introduite par Open data dans les transports en Île de France : et après ?
Les hackathons, internes et externes et autres labs peuvent être de véritables catalyseurs pour la culture de la donnée en sensibilisant les acteurs par l'expérimentation.
![]() |
| Metrography by Benedikt Groß & Bertrand Clerc |
L'Open Data Institute britannique fait de la promotion de la data culture un objectif de premier plan. Le mécénat d’œuvres artistiques utilisant des données est un des moyens utilisés.
Cela donne un air un peu excentrique à l'open space de l'ODI. On y trouve par exemple ce distributeur qui libère ses produits lorsque le mot "recession" est utilisé sur la BBC (une oeuvre particulièrement coûteuse en ce moment) ou cette "metrography" de Benedikt Groß & Bertrand Clerc qui distord une carte pour la faire correspondre au plan du métro de Londres.
Dans un registre similaire, mais plus démocratique, les agitateurs de La Fonderie avaient réalisé l'Expoviz en 2012 dont le site mérite le détour et une exploration approfondie.
Alors, quels sont, pour vous, les moyens de développer la culture des données dans nos entreprises et administrations ? est ce un enjeux ?
Cet article fait partie d'une série "post open data" introduite par Open data dans les transports en Île de France : et après ?




