Mit dem Linienfehlertest kannst du auf recht einfache Weise abschätzen, wie gut dein Modell im Verhältnis zum Wettmarkt abschneidet. Wichtiger noch: Du kannst damit messen, ob du dein Modell mit deinen Veränderungen verbesserst oder verschlechterst.
Wie der Linienfehlertest funktioniert: das Kernprinzip
Den Linienfehlertest kannst du sowohl für Buchmacherquoten (siehe dazu auch meinen Blogpost Wettquoten verstehen), als auch für deine eigenen Modelle verwenden – sofern diese die geschätzten Unterschiede zwischen den Teams in Toren (wie beim Fußball oder Eishockey), Runs (Baseball) oder im sonst wie gegebenen Spielstandformat ausdrücken.
Denn beim Linienfehlertest gleichst du den real erzielten Spielstand mit der vorangegangenen Schätzung ab. Die Differenz bezeichnet den Linienfehler, daher der Name dieser Methode. Diesen Abgleich nimmst du nicht nur für eine bestimmte Begegnung vor, sondern gleich für eine Vielzahl von Spielen, beispielsweise eine ganze Saison. Gemittelt über viele Spiele hinweg kannst du so die Qualität verschiedener Modelle untereinander und mit dem Wettmarkt abgleichen.
Was du für den Linienfehlertest benötigst
Um den Linienfehlertest durchführen zu können, benötigst du ein Modell, dass dir eine Spielstandschätzung abliefert – eine Wahrscheinlichkeitsschätzung hilft dir hier also erst einmal nicht weiter. Wenn du mit Hilfe des Linienfehlertests auch die Qualität der Buchmacherschätzung messen willst, dann benötigst du die 50%-Linie des Buchmachers. Dazu habe ich bereits zwei aufeinander aufbauende Blogposts verfasst, deren Kenntnis ich hier voraussetze:
- Wie du ein Wettmodell bauen kannst (1b): Die 50%-Linien des Buchmachers berechnen
- Wie du ein Wettmodell bauen kannst (1c): Die 50%-Linien des Buchmachers mit Libre Calc berechnen
Der Linienfehlertest an den Beispielen Dortmund und Schalke in der Champions League
Am letzten Spieltag der Champions League kamen Dortmund und Schalke auf Pinnacle bei den beiden Asiatischen Handicaps, die am nächsten an der 50%-Linie lagen, auf folgende Closing Lines:
Tabelle 1: Closing Lines
Heim | Heim-AH | Heimquote | Gast | Gast-AH | Gastquote | |
---|---|---|---|---|---|---|
Galatasaray | Schalke | |||||
Galatasaray | Schalke | |||||
Dortmund | Atletico | |||||
Dortmund | Atletico |
Wenn du die Wettquoten normalisierst [1], dann ergibt sich in Wahrscheinlichkeiten betrachtet folgendes Bild für die Wettquoten der Partie:
Tabelle 2: Wahrscheinlichkeiten auf Grundlage der normalisierten Wettquoten
Heim | Heim-AH | Heimwette gewinnt | Gast | Gast-AH | Gastwette gewinnt | |
---|---|---|---|---|---|---|
Galatasaray | Schalke | |||||
Galatasaray | Schalke | |||||
Dortmund | Atletico | |||||
Dortmund | Atletico |
Mit diesen Daten kannst du jetzt zunächst die Steigung m berechnen [2], und mit Hilfe der Steigungen schließlich die Werte für die jeweiligen 50%-Linien [3]. Das führt dich zu folgenden Werten:
Tabelle 3: Steigungen und 50%-Linien
Heim | Heim-AH | P (Heim) | Gast | Gast-AH | P (Gast) | Steigung | 50%-Linie Heim | 50%-Linie Gast |
---|---|---|---|---|---|---|---|---|
Galatasaray | Schalke | |||||||
Galatasaray | Schalke | |||||||
Dortmund | Atletico | |||||||
Dortmund | Atletico |
Diese Ergebnisse lassen sich folgendermaßen interpretieren:
- Der Wettmarkt hat Galatasaray zu Hause kurz vor Anpfiff im Schnitt um 0.007 Tore besser eingeschätzt als Schalke. Würde man das Match also unendlich oft wiederholen, müsste man Galatasaray 0.007 Tore abziehen, um die Partie zu einer fairen Angelegenheit zu machen und langfristig beim Aufaddieren aller Tore auf ein komplett ausgeglichenes Ergebnis zu kommen.
- Dagegen hat der Wettmarkt Dortmund zu Hause um 0.071 Tore schlechter als den Gegner Atletico Madrid eingeschätzt. Um die Partie fair zu gestalten, müsste man Dortmund also 0.071 Tore zuerkennen, um langfristig Torgleichheit herzustellen.
Die Berechnung des Linienfehlers
Im letzten Schritt berechnest du den Linienfehler der Closing Lines, indem du die Differenz des real erzielten Ergebnisses und die Torschätzung der 50%-Linie aufaddierst.
Tabelle 4: Ergebnis des Linienfehlertests
Heim | 50%-Linie Heim | Gast | 50%-Linie Gast | reales Ergebnis | Heim +/- | Gast +/- | Linienfehler Heim | Linienfehler Gast |
---|---|---|---|---|---|---|---|---|
Galatasaray | Schalke | 0-0 | ||||||
Dortmund | Atletico | 4-0 |
Ergebnis des Linienfehlertests für die gesamte bisherige Champions League Saison
Die eben dargestellten Rechenschritte habe ich für alle Spiele der Champions League ab der Gruppenphase durchgeführt, in allen Partien auf der Grundlage der Pinnacle Closing Lines. Hier ist das entsprechende Libre Calc Dokument, falls dich die Rechnungen und die Ergebnisse interessieren:
2018-10-26-linienfehlertest-ucl-saison-2018-19-nach-spieltag-3.ods |
Aus Heimsicht kommst du also auf einen durchschnittlichen Linienfehler von +0.091. Im Mittel liegt die Schätzung auf Basis der Pinnacle Closing Line im Lauf der bisherigen Saison also weniger als ein Zehntel Tor von den tatsächlichen Spielergebnissen entfernt.
Wie du den Linienfehlertest interpretieren kannst
Der so errechnete Wert dient dir nun als Bezugsgröße für dein jeweiliges Modell. Sollte dein Modell einen geringeren Linienfehler aufweisen als die Pinnacle Closing Line, dann wirst du mittel- bis langfristig extrem viel Erfolg mit deinem Modell haben. Allerdings ist das für reife Märkte wie die Champions League weder zu erwarten, noch zwingend nötig. Es reicht schon, einigermaßen in die Nähe zu kommen.
Dein primäres Ziel sollte es sein, den Linienfehler deines Modell mit deinen Veränderungen abzusenken; wenn du das erreichst, hast du dein Modell mit den entsprechenden Maßnahmen aller Voraussicht nach objektiv verbessert.
Fußnoten:
[1] Du normalisierst Wettquoten, indem du sie durch die Summe aller implizierten Wahrscheinlichkeiten aller Wettquoten teilst. Für Dortmund beispielsweise rechnest du beim Nullhandicap [1/Dortmundquote] / ([1/Dortmundquote] + [1/Atleticoquote]) = (1/2.08) / (1/2.08 + 1/1.86) ≈ 0.472
[2] Wie auch im Artikel über die Berechnung der 50%-Linien erklärt, errechnet sich die Steigung m aus dieser Formel:
Bei den beiden Y-Werten handelt es sich um die jeweiligen Wahrscheinlichkeiten, bei den X-Werten um die entsprechenden Handicaps. Der Index 1 bezeichnet die erste Wettlinie, 2 die zweite.
[3] Die 50%-Linie berechnest du mit Hilfe folgender Formel, bei der es sich um die Funktion der Geraden handelt:
Diese Funktion musst du nach x auflösen, was dich zu folgender Formel führt:
(y - y1) / m + x1 = x
Füge 0.5 für y ein (da du die 50%-Linie haben möchtest), für m nimmst du die eben berechnete Steigung. y1 entspricht im Dortmundbeispiel 0 (dem Handicap), x1 entspricht der korrespondierenden Wahrscheinlichkeit 0.472.