Strava et les enjeux des Big data

Si vous êtes abonnés à des réseaux sociaux, l'information ne vous a peut-être pas échappé...

L'entreprise Strava est au coeur d'une vaste controverse concernant la publication massive de données géolocalisées, en l'occurrence des parcours GPS (plus d'un milliard de traces) enregistrés par les sportifs du monde entier qui utilisent ce site. L’application Strava permet en effet de partager sur un réseau social les parcours avec les performances associées (vitesse, allure, distance...). Pour chaque segment de parcours, il est possible de comparer ses performances par rapport aux autres utilisateurs, ce qui en fait un site très apprécié par les sportifs, notamment les militaires. Collectées et analysées par de puissants algorithmes, ces données nettoyées sont mises en ligne chaque année par l’entreprise Strava sous la forme de cartes de chaleur (Heat maps) interrogeables par activité (Activity Type) :


Les cartes produites permettent d’identifier les parcours les plus utilisés (plus la trace est blanche, plus elle est utilisée), de nouveaux chemins peu usités ou peu connus, des parcours dans des zones non habitées ou non occupées... sauf peut-être par des bases militaires. Plusieurs sites militaires apparaissent dans des pays où l'activité enregistrée par Strava est quasi nulle. Cela concerne surtout des bases militaires américaines en Afghanistan, en Irak et en Syrie. En Syrie par exemple, on peut apercevoir près d'un barrage des trajets qui dessinent une possible base militaire américaine, là où les images satellites ne montrent que des champs. La France n'est pas en reste. Au Mali, où elle est engagée depuis 2014 pour l'opération Barkhane, plusieurs sites montrent une activité intense au milieu du désert, comme le poste avancé de l'armée française à Tessalit, au nord du pays :


Comme l'a révélé sur Twitter Nathan Ruser, un étudiant australien qui s'intéresse à la sécurité internationale et au Moyen-Orient, la géolocalisation de Strava qui montre les « points chauds » d'utilisation, permet de tracer des parcours de footing autour de bases militaires, les soldats étant très friands de l'application. Ce problème de géolocalisation et d’utilisation des réseaux sociaux est pris au sérieux par le Ministère français des armées. En 2012, un code de bonne conduite pour les réseaux sociaux a été diffusé à l’attention des militaires et des personnels civils de la défense, ainsi qu’à leurs familles. Concernant la géolocalisation, l’armée demande la désactivation du smartphone lors d’un déploiement en opération. Mais il semble que les militaires l'activent encore souvent lors de leur jogging hors opération. L'entreprise Strava a rapidement réagi par un communiqué où elle s'engage à "travailler conjointement avec l’armée et les membres du gouvernement pour dresser une liste des données potentiellement sensibles" et à "une simplification de gestion des paramètres de confidentialité et de sécurité pour que les membres Strava puissent y avoir recours encore plus facilement. » (Lettre à la communauté des utilisateurs de Strava, 29 janvier 2018).

D'autres usages peuvent cependant être faits de cette énorme base de données cartographiques. Cela ouvre des possibilités intéressantes pour repérer les hauts-lieux sportifs (hotspots), pour mieux comprendre la fréquentation de certains parcs naturels ou de certains espaces d'accueil. Les zones délaissées où presque aucun utilisateur n'est connecté à Strava révèlent également les "trous noirs" d'Internet, comme par exemple ici la Corée du Nord par rapport à la Corée du Sud :


La galerie de hotspots sélectionnés par le site Strava permet de découvrir les nouveaux terrains de jeu des sportifs qui ne concernent plus seulement la terre, mais aussi la mer avec des courses de natation ou des championnats de kitesurf. Il est même possible d'approfondir l'analyse en comparant les pratiques sportives sur un même lieu :

Comparaison entre les pratiques des VTTistes (à gauche) et les pratiques des skieurs (à droite) à Whistler en Colombie-Britannique 

Comparaison entre les pratiques des cyclistes (à gauche) et les pratiques des coureurs (à droite) à la Réunion

 La presqu'île de Quiberon avec son célèbre triathlon dont une partie se déroule en mer et l'autre à terre.

Les cartes sont accessibles sur le site de Strava et incorporables directement dans QGis sous forme de service WMS. Avec la multiplication des objets connectés, on peut s'attendre à d'autres fuites involontaires d'informations sensibles, notamment au travers des outils de Data vizualisation. Le cas de Strava est néanmoins intéressant par son ampleur et par l'importance des questions liées à la géolocalisation et à la masse d'informations géospatiales mises à disposition. Il permet de dégager quelques enjeux des Big data sur le plan individuel et collectif :

Un enjeu ethique. Conçu comme un véritable comparateur d'efforts, Strava permet d'évaluer en continu ses performances et de se mesurer à celles des autres : c'est la course aux "KOM" (traduisez "King of Montain") qui sont les meilleurs temps enregistrés par segment et qui vous donnent en quelque sorte le maillot jaune. Cela interroge les comportements que Strava et d'autres sites similaires sont en train d'imprimer, dans un rapport à soi et aux autres qui semble en partie remodelé par les outils de géolocalisation (un enjeu donc également identitaire). Le risque est de rendre le sportif accro au point de vouloir repousser sans cesse ses limites... quitte parfois à piller les données de ses adversaires ou à contourner l'esprit sportif par la triche (voir parmi les liens ci-dessous).

Un enjeu sécuritaire. En surlignant les trajets parcourus par ses utilisateurs, l’application Strava a involontairement révélé l’emplacement de certaines bases militaires censées rester ignorées du grand public. Il ne s'agit pas forcément de sites secrets, mais l’activité de Strava a « pour effet de détourer des bâtiments qui s’avèrent être des bases militaires ou d’autres sites sensibles, pas nécessairement référencés avec cette précision jusqu’à présent » comme le pointe Olivier Desbiey, chargé des études prospectives à la Commission nationale de l’informatique et des libertés. On peut affirmer plus généralement que la sécurité des données personnelles est remise en cause. Quel peut être le degré de confidentialité lorsque l'on dépose des données personnelles sur des réseaux sociaux qui pourront à leur tour les réutiliser à d'autres fins ? La question ne se pose pas seulement pour Strava, mais pour tous les réseaux sociaux (Facebook, Whatsapp, Instagram, Twitter, Google+...), a fortiori lorsque ceux-ci ont tendance à s'intéresser à la géolocalisation de leurs utilisateurs (voir par exemple les utilisateurs tracés dans Citymapper suite à une faille de sécurité ou encore les données de géolocalisation enregistrées par Google Timeline). Tel est pris par le GPS activé de son téléphone celui qui croyait prendre les traces des autres utilisateurs : on est surveillé en même temps qu'on surveille les autres. A ce jeu du chat et de la souris où les rôles peuvent s'inverser, certaines organisations criminelles commencent à s'adapter en organisant un brouillage GPS pour ne pas être repérées.

Un enjeu informationnel. Si la géolocalisation a servi initialement les intérêts de l’armée (le système GPS est resté volontairement dégradé par l'armée américaine jusqu'au début des années 2000), cette technologie a largement été ouverte au grand public. L'information spatiale géolocalisée est devenue une information sensible, qui peut affecter aussi bien la vie privée d'un individu que la sécurité d'une nation. En diffusant des masses d'informations géolocalisées jusque-là souvent gardées jalousement par les Etats ou par les grandes sociétés, les réseaux sociaux donnent à voir le monde tel qu'il est, son fonctionnement, sa face parfois cachée. En cela ces cartes peuvent constituer des instruments de pouvoir et de contre-pouvoir.

Un enjeu stratégique. Pour les gestionnaires, les associations, les entreprises, c'est l'occasion d'avoir un retour des usagers qui donnent à voir leurs pratiques, leurs goûts, leurs préférences (voir par exemple la cartographie du running à Paris en 2016). Autant dire un formidable outil stratégique pour augmenter son audience ou son impact et nombre de sociétés spécialisées ont bien compris les enjeux économiques de la géolocalisation. Soixante-seize villes et régions dans le monde utilisent les données de Strava métro pour évaluer et définir leur politique de transport. Ces bases de données géolocalisées peuvent servir également comme outils d'aide à la décision, pour optimiser la gestion des infrastructures existantes, faire des choix d'aménagement, mieux répondre en somme à nos besoins collectifs... quand bien même l'individu géolocalisé de plein gré ou à son insu n'a souvent rien demandé ! Le Conseil d'Etat a de ce point de vue rappelé le 15 décembre 2017 l'interdiction de contrôler le temps de travail des salariés par la géolocalisation.

http://www.geluck.com/actu-geluck-285.html
Philippe Geluck ®


 Paris, Rues Sportives
Cartographie du running à Paris en 2016, via les données de Running Heroes.


 Carte des traces des coureurs à Sydney sur le site Flowing Data

Lire notre billet sur le Big data et les choix d'aménagement urbain à travers l'exemple de Strava metro.


Liens à consulter
  • Cartes accessibles en géovisualisation sur le site de Strava et incorporables directement dans QGis sous forme de service WMS.
  • Strava : les bracelets connectés révèlent des données militaires confidentielles. Article du 29 janvier 2018 consultable sur Le magazine Cloud et Big data.
  • L'usage détourné des big data de Strava met en danger les militaires. Article du 1er février 2018 consultable sur Le Monde informatique.
  • Quand le big data provoque une big cata. Article à lire sur le blog @Korben 
  • Strava : ce que préconise l’armée française sur la géolocalisation. Consultable sur le site Numerama. A compléter par un 2e article concernant la désactivation du partage de données dans l'application Strava, une nouvelle option mise en place en février 2018.
  • Le jeu du chat ou de la souris ou le brouillage au sein des groupes criminels. Consultable sur le Journal du Net (octobre 2015).
  • Big Data, Big Problems: How Strava's Heat Map Uncovers Military Bases. Vidéo à consulter sur Wral.com.
  • En quoi les Big Data sont-elles personnelles ? Consultable sur le site InternetActu.net
  • Strava, le réseau social qui rend les cyclistes accros. Consultable sur le blog Social Cycling.
  • How to spot a Stravasshole. Vidéo humoristique sur Youtube montrant le comportement des cyclistes avant et après Strava.
  • Ce que les big data peuvent apprendre aux sportifs de haut niveau. Consultable sur le site de Sciences & Avenir.
  • Cartographie du running à Paris en 2016, via les données de Running Heroes. Consultable sur le site Paris rues sportives.
  • Where People Run in Major Cities. Cartes des traces des coureurs dans les grandes métropoles sur Flowing Data.
  • Les données des sportifs : utiles aux gestionnaires d'espaces naturels ? Consultable sur le site Pôle Lagune Méditerranée.
  • City planners tap into wealth of cycling data from Strava tracking app. Consultable sur le site du journal The Guardian
  • Galerie de hotspots (haut-lieux de pratiques sportives) sélectionnés par le site Strava.