Suivre la course au plus près et disposer d’une manne de données résolument complètes sur les différents coureurs qui ferraillent pendant trois semaines sur les routes du Tour de France mais également sur la configuration – en temps réel – des 21 étapes qui jalonnent la Grande Boucle est possible, depuis 2015, grâce à l’expertise de la société sud-africaine Dimension Data. Avec une petite nouveauté cette année : l’introduction du Machine Learning.

Analyser sous toutes les coutures l’attaque fulgurante et efficace de Romain Bardet dans les derniers hectomètres de l’ascension vers Peyragudes, lui permettant de déposer le futur maillot jaune Fabio Aru ou encore « comprendre » la -légère – défaillance de Christopher Froome dans cette même dernière difficulté du jour ce jeudi 13 juillet n’est plus « réservé »  aux experts et autres suiveurs de la plus belle course du monde. En effet, grâce à l’expertise de la société sud-africaine Dimension Data, ces données sont également accessibles, pour la troisième édition consécutive, aux téléspectateurs. Si Dimension Data fait également œuvre de sponsoring sur ce tour avec une équipe abritant notamment en son sein le sprinteur Mark Cavendish, la société est davantage reconnue pour être le partenaire technologique officiel du Tour de France depuis l’année 2015. Depuis lors, Dimension Data travaille de concert avec Amaury Sport Organisation (A.S.O), qui n’est autre que l’organisateur du Tour de France pour, comme évoqué en préambule, révolutionner l’expérience de visionnage pour les amateurs de cyclisme. Avec une petite nouveauté cette année, et non des moindres : l’introduction du « Machine Learning », qui permet d’enrichir la plateforme analytique dont dispose Dimension Data et faire vivre au plus près la course aux aficionados de la petite reine.

Dans le détail, la plateforme analytique de Dimension Data, développée en partenariat avec A.S.O., incorpore des algorithmes complexes de Machine Learning qui combinent les données en direct et les historiques de la course afin d’approfondir l’analyse tout au long de l’épreuve. Les fans auront ainsi également accès au profil des coureurs afin d’en savoir plus sur les environnements et les circonstances dans lesquels ceux-ci sont les plus performants. En clair, grâce à ces technologies d’analyses prédictives, tous les scenarii sont sur la table et notamment de prévoir – avec une certaine précision –  quelles sont les chances du peloton de revenir sur des coureurs échappés durant certaines étapes. Mais en pratique comment cela se passe-t-il ? Et surtout par quel(s) biais sont recueillies les différentes données ?

Des balises sous les selles

Joint par nos soins, Scott Gibson, Group Executive – Digital Practice de Dimension Data, déroule par le menu le modus operandi. « Chacun des 198 vélos (nombre de coureurs au départ de Dusseldörf le 1er juillet dernier avant abandons , ndlr) est équipé de balises GPS fixées sous la selle de chaque coureur. Le réseau utilisé est celui de la chaîne de télévision Eurosport ». Ainsi, les données recueillies au moyen de ces balises sont combinées à des informations extérieures sur le dénivelé de la course et les conditions météo afin de produire des analyses concernant, par exemple, la vitesse et la position des différents coureurs, les écarts entre coureurs et la composition des groupes au sein de la course. Cette solution s’appuie sur un datacenter virtualisé et entièrement hébergé dans le cloud, ce qui multiplie sa capacité et nécessite moins de personnel sur le terrain pour son fonctionnement. Le cloud apporte également de la souplesse sur le plan géographique car il peut être managé partout dans le monde. Cette année, les équipes techniques de Dimension Data collaboreront entre elles sur quatre continents via des hubs mobiles hyperconnectés, équipés des plus récentes technologies numériques pour l’environnement de travail.

Au total, ce sont donc 198 coureurs répartis dans 22 équipes qui vont générer plus de 150 millions de données géospatiales et environnementales relevées le long du parcours de 3 540 km. « Cette plateforme permet de disposer d’une quantité d’informations, comme la vitesse en temps réel, la localisation précise de chaque coureur, le pourcentage de la route que le coureur est en train de gravir lors des étapes de montagne, particulièrement suivies et appréciées des téléspectateurs, ou les différents écarts entre les principaux favoris. Il faut savoir qu’avant 2015 et ce partenariat ce dernier aspect était mesuré « à la main », via des journalistes avec des chronomètres sur le bord de la route », développe Scott Gibson. 

« Cinq des sept vainqueurs d’étapes annoncés »

Une montée en puissance qui fait résolument office de maître-mot et de leitmotiv des équipes de Dimension Data. Et pour cause, la plateforme de la SSII sud-africaine est véritablement montée en gamme depuis le début de son histoire avec le Tour de France. 2015 a marqué le début de l’idylle avec des informations essentiellement destinées à la télévision, 2016 a été l’année de « présentation » ou de démocratisation au grand public (site web, Twitter Feed) avant que 2017 ne scelle l’avènement du Machine Learning. « Il s’agit d’une technologie qui a, bien évidemment, été développée chez Dimension Data à d’autres fins que le cyclisme », sourit Scott Gibson. Et d’ajouter. « Mais elle est particulièrement adaptée au sport et offre des outils supplémentaires, et non négligeables, pour prévoir les potentiels vainqueurs d’étape ». Et les résultats sont éloquents. « Si l’on se réfère aux chiffres de la première semaine, en l’occurrence les sept premières étapes, la plateforme a annoncé avec succès 5 des 7 vainqueurs », souligne Scott Gibson. Il reste désormais une semaine de course avant de savoir qui sera en jaune dimanche et lèvera les bras sur les Champs Elysées pour cette édition 2017. Les paris sont ouverts.