La saison de marathon bat son plein. Dimanche, Kelvin Kiptum s'est imposé à Londres dans le temps époustouflant de 2 h 01'27'', deuxième chrono de l'histoire. Le Kényan a échoué à 18 secondes du record du monde d'Eliud Kipchoge. Le week-end précédent, Boston a accueilli le deuxième des six «marathons majors». Lors de ces manifestations, des milliers de coureurs poursuivent des objectifs personnels, des records officiels ou même des marques historiques.
La marque la plus mythique du marathon est bien sûr celle des deux heures chez les hommes. Le record du monde officiel est de 2 h 01'09'', établi par le Kényan Eliud Kipchoge. En 2019, Kipchoge a même atteint 1 h 59'40'' mais c'était dans le cadre d'un événement non officiel, organisé par Nike et baptisé «breaking2». Ce marathon expérimental a été organisé sur un circuit automobile, avec des meneurs d'allure et des postes de ravitaillement non conformes au règlement. Il a néanmoins montré que la barre historique des deux heures pourrait bientôt tomber officiellement.
D'un point de vue de la modélisation, un défi intéressant se pose à nous: prédire l'année où le premier marathonien franchira le mur de deux heures. Nous nous sommes donc associés aux scientifiques de Datahouse pour prédire cet instant magique. Les spécialistes de l'EPF de Zurich abordent le problème en trois étapes.
Comme pour toute analyse, la base de données sous-jacente est très importante. Quelles sont les données historiques disponibles? Quels paramètres sont-ils inclus? Lesquels ne sont pas pertinents et ignorés? Pour la modélisation des records du monde de marathon, nous avons pris les options suivantes:
Les meilleurs temps du marathon masculin ces 50 dernières années aboutissent donc sur cette courbe de performance:
Cette analyse est utilisée pour examiner des modèles ou des tendances et pour faire des prédictions sur leur évolution. Dans notre série chronologique de marathons depuis 1970, deux points attirent l'attention: la série temporelle est approximativement linéaire et il existe une tendance clairement descendante.
Le modèle montre que la tendance à l'amélioration est d'environ 10 secondes par an et qu'il existe une dispersion «aléatoire» (donc non expliquée par le modèle) de ± 45 secondes autour de la ligne de tendance. Sur la base de ces connaissances issues, il est désormais possible de se risquer à des affirmations sur l'évolution future de la série chronologique.
Nous extrapolons la tendance modélisée et simulons, en tenant compte de la dispersion observée, les évolutions possibles de la série chronologique au cours des prochaines années:
Il est ainsi possible d'établir trois probabilités:
Il convient de noter que ces résultats ne sont valables que dans le cadre des hypothèses posées - à savoir que la série chronologique continue à suivre les mêmes lois que depuis 1970. Des événements imprévus et non modélisés, comme par exemple un changement soudain de règlement de la Fédération mondiale d'athlétisme, peuvent fortement influencer l'évolution future de la série chronologique des marathons et donc compromettre nos estimations. Néanmoins, en «temps normal», le modèle devrait s'appliquer et l'on peut donc s'attendre au premier marathon officiel en moins de deux heures dans une dizaine d'années.