Visualisierungsmöglichkeiten im Profifußball – Die Kooperation zwischen der DFL und AWS
1. April 2021 | Trending | BY Simon Lüttel
Spotlight | Die Digitalisierung schreitet auf allen Ebenen voran und auch im Profifußball wird stetig daran gearbeitet, die Visualisierung von Daten zu optimieren und neue Erkenntnisse zu gewinnen. Im Januar des vergangenen Jahres ging die DFL als erste Fußballliga der Welt eine Kooperation mit dem Datenanbieter Amazon Web Services (AWS) ein. Heute werfen wir einen Blick auf die Zusammenarbeit, sowie weitere Visualisierungs- und Schlussfolgerungsmöglichkeiten.
Premiere im Spitzenspiel
Am 26. Mai 2020 war es so weit. Etwa fünf Monate nachdem die DFL die Zusammenarbeit mit Amazon Web Services bestätigte, gaben zwei neue Features ihre Premiere im Spitzenspiel zwischen Borussia Dortmund und dem FC Bayern München. Realtaktische Formationen und Torwahrscheinlichkeiten wurden erstmals eingeblendet.
Das spielentscheidende 1:0 der Partie erzielte Joshua Kimmich mit einem Heber aus 18 Metern Torentfernung in der 43. Spielminute. Der xG-Wert des Treffers belief sich nach AWS-Berechnungen auf lediglich 0,03, also 3 Prozent. Doch was bedeutet das? Ein Vorstellungsvideo der DFL liefert Klarheit.
xG ist nicht gleich xG
Die expected Goals waren bereits vor der Kooperation zwischen der DFL und AWS ein viel diskutiertes Thema. Mittlerweile gibt es einige Unternehmen, die sich auf die Erhebung und Visualisierung von Daten im Profifußball spezialisiert haben. Die erhobenen Daten sind sich sehr ähnlich. Doch in der Auswertung und Visualierung gibt es häufig Unterschiede, da verschiedene Modelle und Ansätze genutzt werden, um beispielsweise Torwahrscheinlichkeiten zu berechnen. Die Erstellung des bestmöglichen xG-Modells gleicht einem Wettkampf der Statistiker, Mathematiker und Analysten. Es gilt alle Parameter, welche den Torabschluss beeinflussen, in einem Rechenmodell zusammenzufassen. Zu den bekanntesten Unternehmen, die an solchen Modellen arbeiten, zählen unter anderem AWS, fbref, Understat und Infogol.
So gibt es für die Berechnung der Torwahrscheinlichkeit (xG) keine allgemein gültige Formel. Dies führt dazu, dass die berechneten xG-Werte von fbref, Understat, AWS und Infogol nur selten auf zwei Nachkommastellen übereinstimmen. Lediglich bei Elfmetern besteht wenig Uneinigkeit. Bei einem Strafstoß wird die Torwahrscheinlichkeit bei allen Anbietern auf 0,76 beziehungsweise 0,77 eingeschätzt.
Josh Kimmich's chip vs. Dortmund is simply delightful 👀pic.twitter.com/PZInDjHHvv
— GOAL (@goal) November 7, 2020
Bei Kimmichs Siegtor gegen den BVB war die Übereinstimmung der xG-Werte verhältnismäßig hoch. Understat, Infogol und AWS räumten dem Abschluss des Nationalspielers einen xG-Wert von 0,03 ein. Beim Modell von fbref wird nur eine Nachkommastelle angegeben, dort betrug die Torwahrscheinlichkeit 0,1.
Seit der Einführung der xG wurden die Modelle kontinuierlich verbessert. Zu Beginn wurde lediglich die Position des Torabschlusses zur Berechnung der Wahrscheinlichkeit genutzt. Im Laufe der Jahre wurden Umstände wie unter anderem die Höhe des Zuspiele, die Geschwindigkeit des abschließenden Offensivspielers, sowie die Position des Torwarts und der Gegenspieler miteinbezogen.
Der xG-Widerspruch: Moussa Diaby
Dass das Modell des Amazon Web Service in einigen Situationen eher weniger akkurate Torwahrscheinlichkeiten errechnet, zeigte der Treffer von Moussa Diaby beim 3:1-Sieg von Bayer 04 Leverkusen gegen den FC Augsburg im vergangenen Herbst. Die Augsburger führten in der Nachspielzeit einen Eckball aus, bei dem die gesamte Mannschaft aufgerückt waren. Die Leverkusener fingen den Ball ab und starteten den direkten Gegenangriff, der darin endete, dass Diaby den Ball am Fünf-Meter-Raum ins leere Tor einschob. Obwohl kaum jemand daran zweifelte, dass der Franzose den Ball aus dieser Position in das leere Tor einschieben wird, bezifferte AWS die Torwahrscheinlichkeit auf lediglich 0,39, also 39%. Den Abschluss des Franzosen bewertete infogol mit einem xG-Wert von 0,51, Understat mit 0,63 und fbref mit 0,8.
— nico 😾 (@nonico02) October 27, 2020
Doch nicht nur das xG-Modell von AWS hat seine Schwächen. Der Fußball ist ein äußerst dynamisches Spiel, in dem sich Spielsituationen ähneln können, aber, abgesehen von Standardsituationen und Elfmetern, praktisch nie in identischer Art und Weise wiederholen. Für die Berechnung des xG-Werts greift AWS auf eine Datenbank mit mehr als 40.000 Schüssen zu. Doch ein perfektes Modell zu entwerfen, dass alle Einflüsse optimal einordnet, ist nahezu unmöglich. Auf solche Punkte muss von den Kommentatoren eigentlich hingewiesen werden. Dies passierte in den vergangenen Monaten in den Sky-Konferenzen nicht immer. Viel häufiger ist es so, dass der xG-Wert oberflächlich betrachtet und die Information in einem Nebensatz abgehandelt wird.
xG: Erweiterung des Betrachtungszeitraums lässt weitere Rückschlüsse zu
Das Beispiel Diaby machte deutlich, dass es bei den xG-Werten durchaus zu großen Unterschieden kommen kann. Das ist jedoch nicht der Regelfall und kein Grund dem xG-System das Vertrauen absprechen. Betrachtet man die xG-Werte in der Summe der Spiele und nicht im Einzelfall, lassen sich in vielen Fällen interessante Muster erkennen. Bei TV-Übertragungen werden die xG-Werte der Schüsse nach erzielten Toren sowie die aufsummierten xG-Werte der Teams nach Halbzeit- und Abpfiff eingeblendet. Erhöht man den Zeitraum der Betrachtung auf mehrere Partien, lassen sich oft weitere Erkenntnisse gewinnen.
Beispielsweise stellten sich viele Gladbach-Fans die Frage, ob ein Zusammenhang zwischen dem Abwärtstrend der Fohlen im Februar und der Verkündung von Marco Roses kommenden Wechsel zum BVB besteht. Eine Verbindung zur Rose-Entscheidung und einem möglichen Leistungsabfall des Teams ist schnell hergestellt: „Die Mannschaft habe die Motivation verloren und man solle Rose direkt entlassen“, hieß es in zahlreichen Kommentaren in den sozialen Medien.
Doch gibt es überhaupt einen Zusammenhang zwischen den Teamleistungen und der Verkündung? Oder haben die Gladbacher vermehrt Pech gehabt und Resultate erzielt, die den Spielverlauf nicht ganz wiedergeben? Nach einem Blick auf die xG-Resultate der Partien gegen Mainz, Leverkusen, Leipzig und Augsburg, kann man darauf schließen, dass drei der vier Partien tatsächlich auf unglückliche Art und Weise verloren wurden. Statt einer Niederlagen-Serie hätten die Gladbacher fünf Punkte geholt, wenn es nach den expected Goals gehen würde.
Bei Understat gibt es freizugängliche expected-Points-Tabellen. So lässt sich feststellen, welche Mannschaften mehr oder weniger zu erwartende Tore erzielten.
Das Potential der realtaktischen Formationen wird nicht vollends genutzt
Ein weiteres Feature ist die Einblendung der realtaktischen Formationen. In der Visualisierung wird die durchschnittliche Position der Spieler auf dem Platz dargestellt. Da Bundesliga-Trainer sich vor den Partien nur selten in Karten schauen lassen und häufig keine exakten Auskünfte über die taktische Ausrichtung geben, ist in der Visualisierung zweifellos ein gewisses Potential vorhanden.
Im Duell zwischen Borussia Dortmund und dem FC Bayern wurden den TV-Zuschauern in der 11. Spielminute erstmals die realtaktischen Formationen präsentiert. Sowohl beim FC Bayern, als auch beim BVB fand eine Zentrierung der Spielerpositionen aus der ursprünglich erwarteten Formation statt. Eine Ausnahme stellte der BVB-Außenverteidiger Achraf Hakimi dar, der als einziger Spieler etwas weiter Richtung Außenlinie rückte.
Im Regelfall werden die realtaktischen Formationen in der Anfangsviertelstunde eingeblendet und von den Kommentatoren zum Abgleich der erwarteten mit den tatsächlichen Positionen genutzt. Normalerweise erkennt man eine Ballung der Spieler im Zentrum, wie es im Spiel des FC Bayern gegen den BVB der Fall war. Zudem lässt sich erkennen, wie hoch beziehungsweise tief eine Mannschaft steht. In den TV-Übertragungen wird die Einblendung meist mit wenigen Sätzen abgehandelt. Das liegt auch daran, dass die Interpretationsmöglichkeiten sich innerhalb der Anfangsphase, abgesehen vom abgleichen der Positionen, oftmals beschränkt sind.
Ein Problem bei den durchschnittlichen Position ist, dass Spieler sich, je nach Spielphase, grundsätzlich verschieden positionieren. Wenn eine Mannschaft im Ballbesitz ist, versucht sie in der Regel das Spiel möglichst breit zu machen. Hat die gegnerische Mannschaft den Ball, sollen die Räume verknappt und eng gemacht werden. In Defensiv- und Offensivformationen nehmen die Spieler somit verschiedene Rollen und Positionen ein. Die realtaktische Formation zeigt eine weniger aussagekräftigere Mischung aus beidem an.
Daneben wird bei den Einblendungen oft bemängelt, dass diese nicht bei Spielunterbrechungen, sondern während der laufenden Partie angezeigt werden. So kommt es vor, dass Szenen durch die eingeblendete Grafik verdeckt werden.
Einen Schritt weiter: Passmaps als Weiterentwicklung
Realtaktische Formationen gehören seit einigen Jahren zum Tagesgeschäft von Spielanalysten und interessierten Fans. Als eine Art Weiterentwicklung der Durchschnittspositionen lassen sich die Passmaps bezeichnen. Ein Konzept für die Entwicklung von Passmaps stellten Javier López Pena und Hugo Touchette bereits im Jahr 2012 vor. Das Portal 11tegen11 veröffentlicht seit dem Jahr 2015 Passmaps, aus den sich mehr Rückschlüsse ziehen lassen, als aus den realtaktischen Formationen.
Die Passmaps stellen nicht nur die Positionierung der Spieler in der Offensivformation dar, sondern zeigen ebenfalls, wie groß der Einfluss der Spieler auf das Ballbesitzspiel ist. Mit jedem gespielten Pass vergrößert und verschiebt sich der Punkt des Spielers auf der Passmap. Desto mehr Pässe ein Spieler spielt, desto größer wird der Pfeil. So lässt sich mit einen Blick feststellen, welche Akteure bei Ballbesitz wie sehr in das eigene Spiel eingebunden wurden.
Ein gutes Beispiel zur Veranschaulichung lieferte RB Leipzig in der Bundesliga-Partie gegen Arminia Bielefeld am vergangenen Bundesliga-Spieltag.
RB Leipzig war die spielbestimmende Mannschaft, was sich anhand der größeren Punkte und den dickeren Linien innerhalb weniger Sekunden erkennen lässt. Besonders das Abwehrtrio Halstenberg, Orban und Klostermann war im Spielaufbau präsent. Obwohl Leipzig viel Ballbesitz (81%) hatte, gelang es den Sachsen nicht, sich mit Leichtigkeit Chancen herauszuspielen.
Gegenteiliges lässt sich bei der Passmap von Arminia Bielefeld erkennen. Bei dem Team von Uwe Neuhaus lief auf spielerischer Ebene nicht viel zusammen, was sich an den wenigen Linien erkennen lässt. Lediglich die langen Bälle von Torwart Stefan Ortega auf den 1,94m großen Mittelstürmer Fabian Klos kamen regelmäßig an. Die Bielefeld fokussierten sich auf die Defensive und lenkten die Leipziger auf die Flügel. Dies zeigt sich ebenfalls in den Strukturen der Leipziger Passmap.
Einen direkten Vergleich zwischen Passmaps und den realtaktischen Formationen zu ziehen, wäre allerdings nicht fair. Die realtaktischen Formationen werden bei Bundesliga-Partien im Regelfall als Echtzeitdaten eingeblendet. Bis aussagekräftige Passmaps entstehen, dauert es etwas länger. Eine weitere Möglichkeit der Darstellung von Positionen sind Heatmaps. Diese lassen sich unter anderem bei whoscored.com finden.
Umgang mit Innovationen bleibt ausbaufähig
Dass die DFL und die Rechteinhaber gewillt sind, sich mit neuen Technologien und Innovationen auseinanderzusetzen, ist anhand der Kooperation mit AWS erkennbar. Doch die Umsetzung lässt sich bis heute nicht als vollends gelungen bezeichnen, denn sowohl das Timing der Einblendungen, als auch der Umgang mit den Echtzeitdaten bleibt verbesserungswürdig.
Dass neue Statistiken und Metriken einen Mehrwert für Fußballfans bieten können, steht außer Frage. Um das Interesse der Zuschauer zu wecken, ist es jedoch wichtig, dass die präsentierenden Personen mit ihnen bestens vertraut sind und sie für das Publikum angemessen aufbereiten. Wird die Präsentation der Visualisierungen wie eine Pflichtaufgabe behandelt, verlieren die Zuschauer vor den Bildschirmen schnell das Interesse an den Innovationen.
Während der Umgang mit den Visualisierungen in den Live-Schalten ausbaufähig ist, findet in Formaten wie „Bundesliga Weekly“ und „Matchplan“ gelegentlich eine detailliertere Aufarbeitung statt. Zudem erscheinen auf bundesliga.com in unregelmäßigen Abständen Match-Facts-Analysen. Mit der Ermittlung des „Most Pressed Players“ arbeitet AWS in Zusammenarbeit mit der DFL bereits am nächsten Projekt, dass in nicht allzu ferner Zukunft im Bezahlfernsehen debütieren könnte. Ob dieses Feature bei den Zuschauern Anklang finden wird, hängt jedoch vor allem davon ab, ob die Präsentation dieses Mal besser gelingt.
(Photo by Imago)