Mit der WM möchte ich eine weitere Zufallsvariable einführen: OTV-MiF. Diese setzt die Anzahl geholten Punkte ins Verhältnis zu der Anzahl der Minuten, die ein Team im selben Zeitraum in Führung gelegen hat.
Die Kernidee hinter OTV-MiF
Wie alle Zufallsvariablen soll OTV-MiF Teams identifizieren, die besonders viel Glück oder Pech im Verhältnis zu den anderen Teams des Wettbewerbs gehabt haben. Ein möglicher Weg, das zu bewerkstelligen: Du misst, wie viel Zeit die Teams in Führung oder zurück lagen. Diesen Wert setzt du in Bezug zum zählbaren Erfolg, den das Team hatte – also beispielsweise den geholten Punkten.
Wenn du annimmst, dass Team A genauso viele Punkte geholt hat wie Team B, aber dabei deutlich länger in Führung lag, dann liegt der Verdacht nahe, dass der Erfolg von Team A wesentlich weniger mit Zufall zu tun hat als der Erfolg von Team B. Umgekehrt kannst du davon ausgehen, dass ein Team, das viele entscheidende späte Tore kassiert hat, eher Pech gehabt haben dürfte.
Die Berechnung von OTV-MiF
Schritt 1: Erhebung der geholten Punkte
Im ersten Schritt rechnest du für jedes Team die Anzahl der geholten Punkte zusammen. Im Ligabetrieb und in regulären Gruppenspielen ist die Sache klar: für einen Sieg gibt es drei Punkte, für ein Unentschieden einen Punkt und für eine Niederlage null Punkte. Etwas anders liegt die Sache, wenn Spiele in der Verlängerung oder im Elfmeterschießen entschieden werden, wie das in Playoffs und den KO-Runden der WM der Fall ist. Bei einem Sieg in der Verlängerung vergebe ich zwei Punkte, für einen Sieg im Elfmeterschießen einen Punkt.
Für die WM habe ich mich entschieden, für OTV-MiF nur Spiele mit folgenden Merkmalen zu berücksichtigen:
- ausschließlich Qualifikationsspiele
- maximal die letzten fünf Spiele
- nur Spiele, die vor Juli 2017 stattfanden
Diese Auswahl führt dazu, dass manche Teams wie der Iran nur auf zwei Spiele kommen, manche wie Deutschland auf vier, und alle Teams mit Playoffteilnahmen wie Schweden oder Australien auf fünf. Das macht es erforderlich, für die geholten Punkte den Schnitt pro Spiel zu ermitteln, um die Daten vergleichbar zu machen. Auch für den Ligabetrieb wird das im Übrigen notwendig sein, weil immer mal wieder Spiele verlegt werden und deshalb nicht immer alle Teams gleich viel gespielt haben nach jedem Spieltag.
Schritt 2: Erhebung der Führungsminuten
Nun erhebst du die Führungsminuten aller am Wettbewerb beteiligten Teams. Dazu zählst du die Minutenanzahl, die ein Team in Führung verbracht hat, und ziehst davon die Minuten in Rückstand ab. Das Ergebnis teilst du durch die Anzahl der erhobenen Spiele. Im Formelformat sieht das so aus:
Schritt 3: Berechnung der Z-Werte für die geholten Punkte und Führungsminuten
Jetzt berechnest du die Z-Werte für alle Teams, und zwar sowohl für die Führungsminuten, als auch für die geholten Punkte – das Ergebnis sieht für alle WM-Teams (außer Russland) so aus:
Rang | Team | Gruppe | Punkte | Z-Wert Punkte (σ) | Führungsminuten (Schnitt) | Z-Wert FM (σ) |
---|---|---|---|---|---|---|
1 | Deutschland | F | ||||
2 | Spanien | B | ||||
3 | Schweden | F | ||||
4 | Frankreich | C | ||||
5 | Portugal | B | ||||
6 | Belgien | G | ||||
7 | Marokko | B | ||||
8 | Dänemark | D | ||||
9 | Polen | H | ||||
10 | Nigeria | D | ||||
11 | Schweiz | E | ||||
12 | Australien | C | ||||
13 | Serbien | E | ||||
14 | Kroatien | D | ||||
15 | England | G | ||||
16 | Senegal | H | ||||
17 | Ägypten | A | ||||
18 | Mexiko | F | ||||
19 | Island | C | ||||
20 | Brasilien | E | ||||
21 | Argentinien | C | ||||
22 | Uruguay | A | ||||
23 | Japan | H | ||||
24 | Kolumbien | H | ||||
25 | Peru | D | ||||
26 | Costa Rica | E | ||||
27 | Tunesien | G | ||||
28 | Südkorea | F | ||||
29 | Saudi-Arabien | A | ||||
30 | Iran | B | ||||
31 | Panama | G | ||||
- | - | Standardabweichung: | ||||
- | - | Mittelwert: |
Sortiert habe ich die Tabelle nach den Führungsminuten und deren Z-Wert.
Schritt 4: Den Z-Wert der Führungsminuten vom Z-Wert der Punkte abziehen
Jetzt findet der eigentliche Abgleich zwischen dem realen Ergebnis in Punkten und dem Können der Teams statt – hier ermittelst du also die Teams mit besonders viel Glück und Pech. Dazu ziehst du im vierten Schritt den Z-Wert der Führungsminuten vom Z-Wert der Punkte ab. Im Fall von Deutschland und Mexiko sieht die Rechnung also beispielsweise so aus:
- Deutschland: ZP - ZFM = 1.68 – 2.07 = -0.58
- Mexiko: ZP - ZFM = 0.36 – 0.36 = 0
Der Mexiko-Wert wird im Übrigen in der weiter unten folgenden Tabelle nicht 0 sondern 0.01 betragen, was mit Rundungsfehlern zu tun hat.
Schritt 5: Den Z-Wert der Differenz berechnen
Nun berechnest du auch für die Differenz noch einmal den Z-Wert. Und damit hast du die Ermittlung von OTV-MiF für die WM-Teilnehmer abgeschlossen. Das ergibt folgende Tabelle für das WM-Feld (nach OTV-MiF sortiert):
Rang | Team | Gruppe | Z-Wert (σ) Punkte | Z-Wert (σ) FM | Differenz [ZP - ZFM] | Z-Wert (σ) Differenz |
---|---|---|---|---|---|---|
1 | England | G | ||||
2 | Panama | G | ||||
3 | Tunesien | G | ||||
4 | Peru | D | ||||
5 | Uruguay | A | ||||
6 | Belgien | G | ||||
7 | Portugal | B | ||||
8 | Senegal | H | ||||
9 | Brasilien | E | ||||
10 | Saudi-Arabien | A | ||||
11 | Serbien | E | ||||
12 | Island | C | ||||
13 | Spanien | B | ||||
14 | Mexiko | F | ||||
15 | Marokko | B | ||||
16 | Japan | H | ||||
17 | Costa Rica | E | ||||
18 | Argentinien | C | ||||
19 | Australien | C | ||||
20 | Iran | B | ||||
21 | Schweiz | E | ||||
22 | Polen | H | ||||
23 | Deutschland | F | ||||
24 | Südkorea | F | ||||
25 | Nigeria | D | ||||
26 | Frankreich | C | ||||
27 | Dänemark | D | ||||
28 | Kroatien | D | ||||
29 | Ägypten | A | ||||
30 | Kolumbien | H | ||||
31 | Schweden | F | ||||
- | - | - | - | Standardabweichung: | 0.68 | - |
- | - | - | - | Mittelwert: | 0.00 | - |
Die Interpretation von OTV-MiF
Wie auch bei den anderen Zufallsindikatoren steht ein besonders positiver Wert für Teams, die besonders viel Glück gehabt haben. Teams mit einem sehr niedrigen Wert haben dagegen besonders viel Pech gehabt. Teams im Bereich +0.5 bis -0.5 sind dagegen nicht sonderlich bemerkenswert, richtig spannend wird es bei Werten von mehr als +1 oder weniger als -1.
Im nächsten Blogpost erkläre ich, wie du OTV-MiF für die einzelnen Spiele berechnest, und was sich an OTV-MiF möglicherweise noch verbessern lässt.