Le lien entre le retard des trains et l'affluence de voyageurs visualisé sur mbtaviz

Les transports publics, pour autant qu'ils aient ouverts leurs données, se prêtent bien à des visualisations innovantes. Mais le travail réalisé par  Michael Barry et Brian Card dans le cadre du cours de Data Visualization de WPI (Matthew Ward) est une vraie réussite.

C'est une data visualisation qui illustre un phénomène important et souvent mal compris : les perturbations dans les systèmes de transports ferroviaires denses. Le phénomène est expliqué en trois temps :

1/ un train en retard retarde les trains le suivent

Dans un système urbain dense, aux heures de pointes, les trains se suivent pour offrir une capacité maximale. La sécurité des circulations impose, néanmoins, une distance minimum entre les trains. Plus on est proche de cette limite plus la capacité théorique du système est élevée, mais moins le système est résistant. En effet, un train en retard va, presque immédiatement, retarder ceux qui le suivent.

Pour illustrer ce phénomène à partir des données réelles de MTBA, la visualisation présente la marche des trains sur un diagramme temps espace bien connu des cheminots (les auteurs mentionnent, élégamment,  Etienne Jules Marey qui s'est passionné pour l'étude des mouvements et du temps).

Sur ce diagramme, chaque couleur représente une ligne du réseau de transport (ici ligne rouge, bleue et jaune). Chaque ligne de couleur représente l'heure  (axe des y) de passage d'un train donné en fonction de sa distance depuis le point de départ (axe des x). Plus les lignes sont horizontales plus les trains sont rapides... Plus elles sont verticales plus ils sont lents.

Sur le site, la visualisation est interactive et facilite la compréhension.

2/ Certaines lignes sont "structurellement perturbées"

La visualisation suivante compare les marches des trains sur une même mission. Les écarts entre les trains les plus lents et les plus rapides créent des faisceaux plus ou moins larges. La ligne rouge est visiblement, en moyenne plus perturbée que la bleue ou la jaune...


3/ Les voyageurs se déplacent presque tous aux mêmes moments

Les données de validation fournies par les tourniquets d'entrée dans les gares permettent de repérer les flux de voyageurs dans l'espace et dans le temps. La visualisation suivante révèle les "heures de pointes" du réseau et met en évidence le fait que ces heures de pointes varient en fonction des jours de la semaine, mais aussi des gares.

4/ Le surplus de voyageurs retient les trains en gare

En effet, plus il y a de voyageurs sur le quai et dans le train plus le train va devoir rester immobilisé en gare pour permettre l'embarquement et le débarquement, et donc plus il va aggraver son retard et, en période de pointe, ceux des trains qui le suivent. De ce point de vue, les systèmes ferroviaires urbains ont tendances à être instables.
Ce constat, assez intuitif, est conforté par la visualisation ci dessous qui permet de vérifier qu'il y a souvent corrélation entre l'affluence en gare et les retards. Inversement, en dehors des heures de pointe, les trains plus espacés et les quais moins chargés permettent au système d'amortir les aléas.


Au total, cette dataviz est exemplaire : elle raconte une histoire intéressante mais complexe, elle permet aux internautes d'expérimenter de façon interactive, elle reste très simple et chaque élements a un sens et joue un rôle dans la démonstration.

C'est un travail rigoureux qui montre qu'il existe souvent une corrélation entre les retards et l'affluence de voyageurs.Pour ceux que cela intéresse, les auteurs ont aussi publié ce document comme un "making of" de leur dataViz qui explique leur démarche et donne des informations techniques pour ceux qui voudraient se lancer ou adapter leur code.