Les données de Google décrivent la mobilité des métropoles mondiales

Un article récent sur le site de Google Research présente de façon abordable des travaux d'interprétation des traces collectées par Google sur les téléphones mobiles de ses utilisateurs. Ces travaux portent à la fois sur l'interprétation des traces dans le cadre d'une comparaison de la structure de grandes métropoles, mais aussi sur les méthodes permettant de traiter ces données sans compromettre leur confidentialité.

La structure des grandes métropoles fait l'objet d'un article plus détaillé. Google y introduit un indicateur de "hiérarchie de flux" Φ. Φ est proche de 1 pour des villes maillées avec un centre principal dont les flux de mobilité sont relativement homogènes. Φ diminue pour des villes polycentriques pour lesquels des pics de mobilités diffus existent aux emplacements des différents "centres".  L'apport essentiel de Google est surtout de pouvoir calculer cet indicateur pour de très nombreuses métropoles mondiales, quelles qu'en soient la taille ou les spécificités. Le diagramme ci-dessous représente l'indice de hiérarchie de flux pour les 174 villes les plus peuplées du monde.

Cet indicateur est ensuite comparé avec des indicateurs classiquement utilisés pour mesurer l'attractivité d'une métropole : parts modales des déplacements, émissions de CO, de NOx, de particules, la fréquence des AVC dans la population, etc... Il en ressort une corrélation entre l'indicateur de hiérarchie des flux et l'attractivité de la métropole : plus la hiérarchie de flux est élevée, plus les autres indicateurs sont "bien orientés".

L'article conclue en évoquant les travaux permettant de préserver la confidentialité des données personnelles tout en permettant leur utilisation statistique. L'idée générale est d'agréger des données à grande échelle en permettant à une partie de la population de biaiser ses réponses. Il devient alors difficile de garantir la véracité d'une réponse individuelle, mais toujours possible statistiquement de corriger le "biais" des données agrégées.