Transit Data à Paris : 6 tendances pour les données et le mass transit


Du 8 au 10 juillet 2019, quatre-vingt des meilleurs "data-scientists" du domaine du "mass transit" se sont réunis à Paris pour la cinquième édition de Transit Data.
J'ai pu assister à une partie de l'événement, que vous pouvez revivre en remontant le fil twitter  et ai été impressionné par la qualité des participants et  des présentations. Elles sont, cerise sur le gâteau, pour la plupart accessibles en ligne.
Après avoir relu ces présentations, je partage avec vous 6 tendances générales qui me semblent représentatives de l'ensemble, illustrées par quelques présentations :
  1. Une meilleure compréhension des comportements des voyageurs en particulier des critères de choix d’itinéraire en milieu urbain dense. Des comportements spécifiques comme le déni d’embarquement (boarding denial), les itinéraires "à rebours" (back riding ou reverse routing) ou les réactions en cas d’incident (fermeture de gares) font l'objet d'analyse quantitatives inédites et intéressantes. Voir par exemple :  Understanding passenger path choice in congested metro  networks: The  case of reverse routing.
  2. Des analyses sur les couplages voyageurs/exploitation notamment autour des temps d’embarquement, ou des choix d’itinéraires en bus en fonction de l’information disponible ou d’incidents… Voir l’étude japonaise sur les liens entre perturbations  des trains et affluences des voyageurs :  Empirical Investigation of Fundamental Diagram for Urban Rail Transit by Using Commuter Rail Data in Tokyo … 
  3. Un recours fréquents aux méthodes issues du « machine learning » au domaine de la mobilité. Il y a plusieurs exemples d'applications d'algorithmes de clustering dont une sur la vulnérabilité des gares aux perturbations et une sur la segmentation des voyageurs sur la base de leurs données de mobilité. J'ai apprécié la présentation de VEDECOM : Prediction of bus passenger flow using Machine Learning.
  4. Plusieurs études sur la multi-modalité autour des stations de transit ou en substitution du transit associant de nombreuses données dont des données météo ou événementielles…  Voir notamment :  Longitudinal modeling of the daily subway ridership in Montreal: What is the influence of alternative modes of transport ? (non disponible pour le moment).
  5. Moins de présentation sur les questions de tarification. Voir tout de même :  Evaluating the impact of fare capping and guaranteed best fare policies with smart card data and Machine learning.
  6. Un intérêt pour les données ouvertes : GTFS, OSM… qui permettent de construire des benchmarks mondiaux Voir par exemple :Enhanced complex network representation of public transport for accessibility assessment based on General Transit Feed Specification data .
Je serai, bien sûr, heureux d'avoir vos commentaires sur la pertinence de ces tendances et de cette petite sélection... Et surtout, je remercie et félicite les auteurs des présentations, les membres du steering committee, les organisateurs et tout particulièrement Maguelonne Chandesris.

Gouverner les transports à l'ère algorithmique : une étude de l'ITF

En pleine préparation de la Loi d'Orientation des Mobilités et au moment où les transports font plus que jamais l'objet de débats politiques et réglementaires, l'International Transport Forum  (ITF) de l'OCDE publie le 23 mai 2019 une étude intitulée Governing Transport in the Algorithmic Age


C'est l'occasion de saluer la qualité du travail de l'ITF dont les rapports sont clairs et intéressants. Je vous incite à le lire et en retiens quelques pépites que je vous livre.

Le premier mérite de l'étude est d'identifier les risques induits par le recours aux algorithmes dans le domaine des transports de façon concrète et pédagogique.

L'importance des algorithmes mais aussi des données et des réseaux (Data, Networks, Algorithms : the next DNA of transport) pour les transports est illustrée par des exemples variés : guidage des personnes et des véhicules, contrôle d'accès, services innovants de véhicules partagés, de transport à la demande, péages, planification des investissements et, bien sûr, véhicules autonomes...Le rôle croissant des applications, leurs interdépendances via les données qu'elles génèrent et consomment laisse entrevoir un vaste système de mobilité complexe piloté par des algorithmes et bien des dystopies si l'homme perd la maîtrise de l'ensemble !

L'adage "code is law" s'applique parfaitement à la mobilité... mais  le code de la route et plus généralement les outils qui formalisent actuellement la gouvernance des transports sont-ils suffisamment accessibles aux machines ? Est-il souhaitable de "coder" la loi ? de déléguer certaines fonctions réglementaires aux machines ? Comment réguler les algorithmes ?   L'essentiel des recommandations de l'étude éclairent ces questions.

L'étude introduit, d'abord, ce que sont les algorithmes, comment ils fonctionnent et ce qu'ils permettent de faire. L'intelligence artificielle ou plus justement les différentes techniques d'apprentissage automatique (machine learning) ne reposent que sur des algorithmes et ne sont pas exemptes de failles et de biais. La notion de "régulation algorithmique" émerge, elle ouvre de nombreuses questions.

La compréhension des impacts des algorithmes,  souvent positifs et parfois négatifs, est un prérequis peut y répondre. Ces impacts sont illustrés par des cas concrets réels :
  • erreurs de programmations faisant accélérer des automobiles, 
  • défaut dans les interactions entre l'homme et la machine lors des accidents mettant en cause des voitures en "pilotage automatique" dans lesquels l'homme aurait dû reprendre le contrôle du véhicule,
  • introduction de biais et de discriminations dans l'accès à certains services de mobilité... 

Les risques liés aux algorithmes couvrent des catégories étendues de la sécurité des personnes à la défense du bien social en passant par l'équité, la transparence, la responsabilité et la protection de la vie privée.

Dans chaque catégorie les risques sont illustrés concrètement par des failles ou des attaques réelles. Une attaque spectaculaire visant à leurrer les capteurs d'un véhicule autonome en lui faisant prendre un feu vert pour un feu rouge est particulièrement évocatrice des risques.

Pour ceux qui douteraient encore, je ne résiste pas à l'envie de vous partager cette vidéo récente de l'université de Stanford  même si elle n'a pas de lien avec le transport. Elle montre, de façon spectaculaire, à quel point il est facile de leurrer non seulement les algorithmes, mais aussi les gens !

Les différences entre les décisions humaines et algorithmiques sont, d'ailleurs, abordées. Les premières peuvent être mauvaises mais elles sont, en majorité, clairement encadrées par les lois et associées à des principes de responsabilités et de sanctions. Ce cadre résulte de longues observations des risques et de négociations entre les différentes parties prenantes.

Si il semble prématuré de changer ces règles  "analogiques" pour les adapter aux algorithmes, il est nécessaire que les régulateurs prennent mieux en compte l'importance réelle du logiciel dans le domaine des transports.

Dix recommandations découlent de cette analyse :
  1. sensibiliser les autorités aux algorithmes et rendre les politiques des transports compatibles avec les algorithmes,
  2. s'assurer que le contrôle et la tutelle des algorithmes sont bien proportionnés à leurs impacts et aux risques qu'ils induisent,
  3. intégrer, par défaut, des fonctions d'audit dans les algorithmes susceptibles d'avoir un impact important, 
  4. traduire les règles de droits "analogiques" en code lisible par les machines pour permettre leur utilisation par des algorithmes  (l'étude signale que 782 autorités réglementaires dans le monde, dont 39 en France, le Bundestag et la ville de Washington, ont déjà transcrit certaines de leurs règles en code et les ont mises à disposition du public sur Github), 
  5. avoir recours à des algorithmes pour réguler de façon plus dynamique et efficiente (voir les propositions de la ville de Los Angeles pour réguler l'utilisation de l'espace urbain par les services de VTC via un système d'API  nommé Mobility Data Specification dont nous avions parlé ici), 
  6. comparer la performance des systèmes algorithmiques à celle des prises de décisions humaines,
  7. évaluer les algorithmes au delà des critères de transparences et d'explicabilité (développer la notion d'explicabilité "by design"),
  8. mettre en place un cadre robuste pour garantir la responsabilité des décisions prises par les algorithmes (qui doit être attribuée, d'après l'étude, aux entités qui les déploient), 
  9. établir des lignes directrices claires et des actions réglementaires pour évaluer l'impact des prises de décision algorithmiques, 
  10. adapter la façon dont la régulation est élaborée pour refléter la vitesse et l'incertitude liées aux déploiement des algorithmes.

Des cryptomonnaies à la gouvernance des communs ?

Les cryptomonnaies proposent des outils de gouvernance décentralisés. J'ai l'intuition que ces nouveaux outils vont questionner en profondeur la façon dont nos entreprises, et plus généralement notre société sont organisées.
Tout cela semble intéressant pour le secteur de la mobilité qui nécessite une coopération (ou de "co-ompétition") entre les acteurs pour produire des bénéfices pour les clients et les territoires.
J'avoue, néanmoins que la synthèse n'est pas facile à faire et que je n'ai pas réussi à faire un article du genre "les dix raisons de s'intéresser aux crypto-monnaies" pour les acteurs de la mobilité !!
Dans cet article, je me contente de vous livrer un premier état des lieux et serai ravi d'avoir en retour vos avis et compléments !

De quoi parle-t-on ? 

Rappelons que la valeur totale des Bitcoins aujourd'hui est de l'ordre de $80Mds, 15Mds pour Etherum, etc... Ce n'est pas rien, mais ce n'est pas non plus, très significatif à l'échelle des différents actifs  dans le monde. La valeur de l'or, par exemple, semble être de l'ordre de $8000Mds. Voici un graphe issu d'une étude de Savills sur la valeur comparée des différents actifs (à fin 2017) : 

Un écosystème riche !

Ce qui est plus intéressant que la valeur des cryptomonnaies, c'est leur variété. Si on ne s'attache qu'aux 10 premières en valeur, on obtient un panorama varié et des histoires passionnantes. 
  • Bitcoin, Litecoin et Bitcoin Cash : sont fondés sur les principes généraux de l'article fondateur de Satoshi Nakamoto. Bitcoin Cash est le résultat d'un choix fait par un certain nombre de "mineurs" de retenir une version différente des algorithmes de minage pour Bitcoin. Ce phénomène, dit "hard fork", s'apparente à un schisme entre deux communautés en désaccord sur la gouvernance.
  • Ethereum, est une véritable plateforme de programmation décentralisée et pas uniquement une monnaie. Elle permet de programmer des smart contracts qui réaliseront des transactions avec des utilisateurs. Dans leur forme la plus élaborée, ces smart contracts deviennent des entités autonomes distribuées (DAO). Les DAO structurent un dispositif de gouvernance dans lequel des "actionnaires" vont "piloter" les smart contracts sous-jacents, un peu comme les actionnaires d'une entreprise classique.
    Il est intéressant de noter qu'une des premières DAO sur Ethereum (malencontreusement nommée The DAO) a été victime d'un bug. Ce bug a été découvert et exploité malicieusement. Pour récupérer les fonds détournés (environ $50M) la communauté a choisi de modifier l'algorithme de minage... Néanmoins, une partie des mineurs a refusé cette évolution provoquant un "hard fork" à l'origine de la création d'Ethereum Classic... Il y a donc aujourd'hui une partie de la communauté qui possède de l'Ethereum,  qui a retrouvé les fonds et qui a remboursé les détenteurs légitimes. Pendant ce temps, une autre communauté dissidente, qui possède maintenant de l'Ethereum Classic, considère que les fonds détournés sont la propriété du hacker... Au passage, néanmoins, la valeur des fonds détournées est en Ethereum Classic qui s'échange à la date de cette article pour une valeur 30 fois inférieure à celle d'Ethereum. 
  • EOS et Cardano : sont programmables comme Ethereum, mais elles sont sécurisées par des mécanismes de consensus par "preuve d'enjeu" (Proof of stake) plus économiques et écologiques que les mécanismes de "preuve de travail" d'Ethereum et de Bitcoin qui sont gourmands en énergie.    
  • Binance Coin : est un "jeton" (token) crée sur Ethereum et émis par Binance qui est l'un des plus gros sites d'achat et de vente de cryptomonnaies. La création de Binance Coin est une façon pour Binance de fidéliser et de valoriser sa base client. 
  • Ripple et Stellar : sont des cryptomonnaies "centralisées" qui visent à proposer aux banques des mécanismes d'échanges sûrs, très flexibles et à bas coûts.
  • Tether : est un exemple de "stable coin" sensé garantir la parité avec une devise classique (le $) tout en offrant la flexibilité de transaction et de programmation d'une cryptomonnaie. Cette propriété intéressante peut, théoriquement, être atteinte par un mécanisme de garantie par un tiers (donc un dispositif centralisé) qui achèterait et stockerait un vrai dollars pour chaque équivalent distribué sous forme de cryptomonnaies. D'autres mécanismes ont été imaginés et testés, mais à ma connaissance aucun n'a, pour le moment tenu ses promesses.

Une utilité au delà de la "monnaie"

Au carrefour des mathématiques (théorie des jeux, algorithmes répartis...), de l'informatique (en particulier de l'informatique distribuée) et de l'économie, l'essor des cryptomonnaies propose un ensemble de concepts innovants. Ils ne sont pas uniquement liés aux cryptomonnaies ni à la "blockchain", mais ils sont culturellement liés. Ils sont notamment discutés et évalués par les acteurs des cryptomonnaies : développeurs open source, mineurs ou spéculateurs. Je vous en cite quelques uns sans viser l'exhaustivité ni beaucoup de rigueur dans la classification...

Les "tokens" : Ethereum (et bien d'autres plateformes décentralisées et programmables) permettent de créer "des jetons". Il s'agit d'une sorte de certificat digital qui va donner des droits à son possesseur dans le cadre de "smart contracts". Un token peut représenter un droit de vote dans un processus de décision programmé dans un smart contract. Il est souvent cessible et peut, dans certains cas, être opposable à un tiers en vue, par exemple, de la fourniture d'un service ou d'un bien. Certains sont suffisamment échangés pour avoir un "cours" sur les marchés spécialisés en cryptomonnaies.

Les mécanismes de consensus décentralisé visent à faire émerger un fait (ou une valeur) qui sera considéré comme consensuel par une communauté d'acteurs sans qu'ils aient besoin de se "faire confiance"... Ces mécanismes doivent en particulier résister à des comportements malicieux d'acteurs qui souhaiteraient, par exemple, faire émerger un fait qui les privilégie, ou simplement bloquer l'émergence du consensus. Ils fonctionnent sans qu'il y ait de délégation à un tiers de confiance comme c'est en général le cas dans les mécanismes classiques. L'organisation d'un vote classique et le dépouillement des urnes nécessitent un délégation des candidats et des électeurs à un organisateur "de confiance" !  Au passage pour ceux qui souhaiteraient approfondir, je suggère le cours d’algorithmique répartie du College de France par Rachid Guerraoui et en particulier la conférence intitulée Si Blockchain est la solution, quel est le problème ? qui est assez jubilatoire.
Et pour ceux qui ne voudraient pas approfondir, je propose une analogie simple... Le mécanisme qui fait que les spectateurs, à la fin d'un spectacle réussi, vont progressivement se "mettre d'accord" sur le rythme des applaudissements pour demander un rappel est une "sorte de consensus décentralisé". Personne ne dirige le mouvement, au démarrage chacun choisit un rythme différent, mais petit à petit le consensus se crée...Enfin, il est relativement difficile à quelques acteurs "malicieux" d’empêcher la masse des spectateurs de demander un rappel.

L'utilisation de jetons pour la curation de listes  (Token Curated Registry)  est un mécanisme qui aligne les intérêts de : 
  1. "candidats" souhaitant figurer sur une liste,
  2. de "curateurs" devant émettre des avis permettant de maintenir la qualité de la liste, 
  3. des "consommateurs" qui utilisent la liste pour guider leur choix et qui créent alors de la valeur pour les candidats présents sur la liste.
Bien conçu, ce mécanisme est une alternative au recours à un expert éditant la liste. Les motivations de ce tiers sont difficiles à connaitre et il peut avoir intérêt à biaiser la liste....  Or les listes sont au cœur de la plupart des mécanismes collaboratifs notamment pour la gestion d'habilitations (white ou blacklist), La maîtrise de la qualité des listes pourrait, par exemple, aider à combattre le spam, les attaques de type "hameçonnage",  les "fake news" et à réguler les réseaux sociaux.
Les détails du mécanisme sont décrits dans divers documents et implémentés avec des paramètres variés dans plusieurs solutions. La vidéo ci-dessous en donne rapidement une vision pédagogique :



Les votes quadratiques introduisent de la flexibilité dans les mécanismes de vote traditionnels. L'idée est de permettre aux "votants" les plus engagés de voter plusieurs fois en achetant des voix supplémentaires.  Le prix de ces votes croit de façon quadratique (2 puis 4 puis 8 puis 16...). Ce mécanisme permet de prendre en compte l'importance que le vote a pour les différents groupes de votant, sans pour autant permettre à un acteur unique de contrôler le vote en achetant un nombre de voix significatif... En théorie, il conduit au résultat qui représente la valeur la plus élevée pour la communauté participant au vote. Ce concept a fait l'objet d'un  article signé par Vitalik Buterin
fondateur d'Ethereum, Zoë Hitzig du département d'économie d'Harvard University  et par E. Glen Weyl auteur du livre "Radical Markets" dont voici le résumé en une phrase : "Replacing capitalism, democracy and borders with creative forms of auctions can eliminate most inequality, restore robust economic growth, heal our politics and create a truly just society".

Je voudrai remettre les mécanismes cités ici en perspective.

D'une part ils ne sont pas directement liés aux crypto-monnaies. Ils sont plutôt le fruit de contributions de la cryptologie, de la théorie de jeux et de l'informatique distribué dans les mécanismes de gouvernance d'écosystèmes ouverts. Il s'agit, en premier lieu, des communautés de développeurs, de mineurs et d'utilisateurs des différentes crypto-monnaies... Mais la portée des mécanismes me semble plus large.

D'autre part, les "avantages" évoqués doivent être pesés avec soin. Ces mécanismes, une fois codés, ne sont pas exempts de failles. Ils sont loin d'être invulnérables aux manipulations. Il est vrai, aussi, que nous en sommes souvent au stade des premières implémentations et donc, des premières attaques forcément inédites.

Pour conclure

Les crypto-monnaies et les concepts qui les accompagnent peuvent intéresser les entreprises et les organisations en général. Ils me semblent particulièrement adaptés à la gestion des "communs", comme par exemple les logiciels open sources (voir par exemple Gitcoin.)...

Ils devraient, donc, intéresser les acteurs de la mobilité, de l'aménagement des territoires et de la gestion de la cité. C'est déjà le cas et voici quelques acteurs déjà positionnés sur l'utilisation de blockchain : MobiIBMIomob, EY...

Pour cela, une difficulté ne doit pas être sous estimée : le "lien avec le réel". Le lien avec le monde physique, qui semble indispensable pour les services de mobilité, reste apparemment difficile à concilier avec les architectures distribuées. Les informations de localisation (voir notamment l'initiative Foam),  ou de météo, ou de trafic sont généralement fournies par un "tiers de confiance".

Les services purement digitaux eux, semblent plus faciles à décentraliser et peuvent profiter pleinement des mécanismes issus de cryptomonnaies. On peut citer Storj ou IPFS pour le stockage en ligne, Solid pour les données personnelles, Brave le navigateur qui propose une alternative à la publicité (voir cette vidéo très claire).