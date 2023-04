bild: datahouse

Ein Marathon unter zwei Stunden? Gemäss unserem Modell ist es bald so weit

Der Marathon-Weltrekord nähert sich der magischen Zwei-Stunden-Schallmauer. Doch wann wird diese geknackt? watson hat sich mit den Schweizer Datenspezialisten von Datahouse zusammengetan, um diese Frage zu beantworten. Die Antwort: Wir müssen uns nicht mehr allzu lange gedulden.

severin trösch / datahouse

Die Marathonsaison 2023 ist in vollem Gange. Letztes Wochenende wurde in Boston bereits der zweite der sechs jährlichen «Marathon Majors» ausgetragen und heute fand in Zürich der grösste Schweizer Marathon der Saison statt. Tausende Läuferinnen und Läufer verfolgen bei diesen Veranstaltungen persönliche Ziele, offizielle Rekorde oder sogar sporthistorische Marken wie die Zwei-Stunden-Schallmauer.

Eine solche Marke im Marathonlauf ist die Zwei-Stunden-Schwelle bei den Herren: Der offizielle Weltrekord aus dem letzten Jahr liegt bei 2:01:09, aufgestellt vom Kenianer Eliud Kipchoge. Im Jahr 2019 lief dieser in einem inoffiziellen Rennen (mit reglementswidrigen Tempomachern und Verpflegungsstellen) gar eine Zeit von 1:59:40 und deutete damit an, dass die historische Zwei-Stunden-Marke schon bald auch offiziell fallen könnte.

Die aktuelle Weltrekordzeit von Eliud Kipchoge. Bild: keystone

Aus Modellierungsperspektive stellt sich die interessante Herausforderung, das Jahr vorherzusagen, in welchem der erste Mensch in einem offiziellen Marathon diese Zwei-Stunden-Schallmauer durchbrechen wird. Wir haben uns deshalb mit den Schweizer Data-Science-Spezialisten von Datahouse zusammengetan, um den magischen Moment vorauszusagen. Das Spin-off der ETH Zürich geht das Problem in drei Schritten an:

Schritt 1: Datenbasis

Wie bei jeder Analyse ist die zugrundeliegende Datenbasis auch hier sehr wichtig. Welche historischen Daten stehen zur Verfügung? Welche Datenpunkte werden miteinbezogen? Welche sind nicht relevant und werden ignoriert? Für die Modellierung der Marathon-Weltrekorde haben wir diesbezüglich folgende Entscheidungen getroffen:

Wir betrachten nicht nur historische Weltrekorde, welche unregelmässig gelaufen werden, sondern die jeweils beste Zeit der Marathons aus jedem Jahr. Dies ergibt einerseits ein grösseres und robusteres Datenvolumen und lässt andrerseits eine bessere Abschätzung der Leistungsvariation zwischen den Jahren zu. Wir beschränken die Analyse auf die letzten 50 Jahre. Das ergibt Sinn, weil sich das System, welchem die Entwicklung der Weltbestzeiten folgt, über die Jahre plausiblerweise ändert (aufgrund von Faktoren wie der Globalisierung des Sports, technologischem Fortschritt, Änderungen des Wettkampfreglements, etc.)

Als Datengrundlage sollen also die Weltjahresbestzeiten im Marathonlauf der Herren aus den letzten 50 Jahren dienen:

Weltbestzeiten im Marathonlauf der Männer im Jahresverlauf. grafik: datahouse

Schritt 2: Zeitreihenmodell

Auf der Basis der ausgewählten Daten wird nun ein Zeitreihenmodell erstellt. Die Zeitreihenanalyse ist eine spezielle Art der Regressionsanalyse. Sie wird dazu verwendet, Muster oder Trends in einer Reihe von Daten, die über die Zeit gesammelt wurden, zu untersuchen und Vorhersagen über ihren Weiterverlauf zu machen. In unserer Marathon-Zeitreihe seit 1970 fallen zwei Punkte auf: Die Zeitreihe ist näherungsweise linear und es besteht ein klar abfallender Trend:

Marathon-Zeitreihe: Abfallender linearer Trend bei den Männern. grafik: datahouse

Im Regressionsmodell zeigt sich, dass der Verbesserungstrend ~10 Sekunden pro Jahr beträgt und dass eine «zufällige» (also nicht durch das Modell erklärte) Streuung von ca. ± 45 Sekunden um die Trendlinie besteht. Anhand dieser Erkenntnisse aus der historischen Modellierung können nun Aussagen über die weitere Entwicklung der Zeitreihe gewagt werden.

Schritt 3: Vorhersage

Wir extrapolieren den modellierten Trend und simulieren unter Beachtung der beobachteten Streuung mögliche Weiterverläufe der Zeitreihe in den nächsten Jahren:

Bestzeiten Herren: Mögliche Weiterverläufe der Zeitreihe in den nächsten Jahren. grafik: datahouse

So lassen sich Wahrscheinlichkeitsaussagen machen:

Am wahrscheinlichsten ist der erste Sub-Zwei-Stunden-Marathon in den Jahren 2032 bis 2034. In über 40 Prozent der Simulationsläufe fällt die Grenze in diesen drei Jahren.

Die Wahrscheinlichkeit, dass die Zwei-Stunden-Schwelle noch im Jahr 2023 unterschritten wird, ist kleiner als 1 Prozent.

Bis im Jahr 2040 werden wir gemäss Modell fast sicher (>99 Prozent) einen ersten offiziellen Marathon unter zwei Stunden beobachten können.

Es ist zu beachten, dass diese Resultate nur im Rahmen der getroffenen Annahmen – also dass die Zeitreihe weiterhin den gleichen Gesetzen wie seit 1970 folgt – gültig sind. Unvorhergesehene und nicht-mitmodellierte Ereignisse wie beispielsweise eine plötzliche Reglementsänderung des Leichtathletik-Weltverbandes können den weiteren Verlauf der Marathon-Zeitreihe stark beeinflussen und unsere Schätzungen somit gefährden. Trotzdem: Im «Normalfall» dürfte das Modell zutreffen und somit in etwa 10 Jahren mit dem ersten offiziellen Marathon unter zwei Stunden zu rechnen sein.