Resultat och diskussion - Analys av prestations- och prediktionsvariabler inom fotboll

Syftet med undersökningen är inte att ta reda på vilka prestationsindikatorer eller vilka prestationsvariabler som är mest betydelsefulla under säsongen 2015-2016. Tanken är att snarare mer generellt ta reda på hur mycket de påverkar en fotbollsmatch. Dock bör försiktighet vidtas med att övergeneralisera resultaten över allt för stora tidsramar.

Då data är tillgänglig över hela säsongen kan överanpassning av modellen komma att bli ett problem. Därför delas datan upp i ett tränings- och testset. Uppdelningen av observationerna består av 75 % träningsdata och 25 % testdata. När beslutsträdet och de tre

ensemblemodellerna byggs konstrueras de med information från träningsdatan. Dock gäller ifall andelen felklassifikationer minskar på träningsmodellerna behöver inte det betyda att andelen felklassifikationer kommer att minska för testdatan. Det är möjligt att justera ensemblemodellernas iterationsantal och bootstrapandel för att sänka andelen

felklassifikationer. Målet med dessa modeller är att hitta den underliggande relationen som de oberoende variablerna har med den beroende variabeln. Ifall ensemblemodellerna överjusteras kommer de och beslutsträdet att försöka förklara den oförklarade variationen. Detta leder till att ensemblemodellerna och beslutsträdet blir överanpassade. Därför innebär det att modellen med lägst andel felklassifikationer i testdatan anses vara den bästa modellen.

De fyra valda metoderna som ska klassificera slutresultat i fotbollsmatcher och betydelsen av de olika prestationsindikatorerna är beslutsträd, bagging, random forest och adaboosting. Inledningsvis ska den bästa metoden av dem fyra väljas. Den bästa modellen definieras som den modell som har högst antal rättklassificerade matchresultat i testdatan.

När den bästa modellen erhållits kommer fortsättningsvis undersökningen att ta reda på vilka variabler som är viktigast för att förutspå hemmavinst, oavgjort eller bortavinst. Detta görs med måttet medelminskningen av de korrekt klassificerade observationerna för varje iteration. Prestationsindikatorernas betydelse kommer att tolkas som hur bra eller dåliga de är på att diskriminera slutresultatet i en match.

Prestationsvariabler

Det är olika parametrar som skall justeras för de olika ensemblemetoderna. Både bagging och random forest-metoden är ensemblemetoder som baseras på bootstrapping, vilket betyder att vid varje iteration slumpas en delmängd av träningsdatan för att bygga ett beslutsträd. Denna andel justerades till 60 %. Olika storlekar på denna andel testades men ledde inte till något förbättrat resultat.

För random forest-metoden är , där är det totala antalet variabler, rekommenderat som antalet slumpade variabler som ska bygga ett träd. I detta fall är , vilket avrundades till 6 stycken slumpade variabler. Om värdet på är för högt kommer träden att korrelera vilket leder till att variansen för ensemblemodellen ökar. Bagging-metoden använder variabler, alltså samtliga 37 prestationsvariabler.

Eftersom att testdata var tillgängligt valdes antal iterationer baserat på den iterationen med lägst andel felklassifikationer av 1000 iterationer. Detta betyder att 1000 iterationer görs för samtliga ensemblemodeller, sedan observeras iterationen med lägst andel felklassifikationer.

Denna iteration väljs sedan som slutlig iterationspunkt för ensemblemodellen. I Figur 9 presenteras andelen felklassifikationer för adaboosting-metoden. Adaboosting-metoden är lite annorlunda gentemot bagging och random forest. Målet med ensemblemodellerna är att de ska sänka andelen felklassifikationer omgående för varje extra iteration. Adaboosting-metoden har en låg varians då den är uppbyggd på många svaga och viktade klassificerare. Istället får den lägre väntevärdesriktighet men att väntevärdesriktigheten ökar omgående för varje extra iteration.

Figur 9 - Figur som beskriver andelen felklassifikationer för varje iteration för ensemblemetoderna. Notera att Y-axlarna är olika stora och i random forest-metoden (uppe till vänster) är den svarta linjen den som representerar andelen

felklassifikationer.

I figur 9 visar det sig att adaboost-metoden presterar som bäst vid 55 iterationer. Fastän väntevärdesriktigheten ökar i träningsmodellen för varje iteration efter den 55:e, presterar den fortfarande aldrig lika bra i testdatan som vid den 55:e iterationen. Det kan bero på att

modellen har blivit överanpassad till träningsdatan och blir därför sämre på att förutspå slutresultatet i testdatan efter den 55:e iterationen. Det går att tolka som att den underliggande relationen för prestationsindikatorerna presterar flest antal rätt klassificerade slutresultat vid den 55:e iterationen.

Bagging och random forest-metoderna är nästintill väntvärdesriktiga men dock är variansen hög. För varje iteration sänks variansen för dessa ensemblemodeller vilket sänker andelen felklassifikationer. I figur 9 presenteras andelen felklassifikationer för bagging-metoden. Den underliggande relationen mellan de oberoende variablerna och den beroende variabeln är som bäst representerad efter 22 iterationer. På samma sätt kan den iteration med lägst andel

felklassifikationer också hittas i figur 9 för random forest-metoden.

I tabell 4 presenteras en samanställning på hur bra samtliga ensemblemodeller och beslutsträdet predikterar slutresultatet vid de bästa iterationspunkterna (för varje ensemblemodell). % rättklassificerad träningsdata % rättklassificerad testdata Slumpade variabler Iterationer Bootstrap storlek Beslutsträd 78.2% 50% - - - Bagging 65.5% 61.2% 37 22 60% Random Forest 45% 58.7% 6 422 60% Adaboosting 100% 60% - 55 -

Tabell 4 - Tabell över hur de olika prestationsvariablerna presterade med de olika modellerna

Det enstaka beslutsträdet lyckades att prediktera 78 % rätt med träningsdatan och 50 % med testdatan. Detta tyder på att trädet blev överanpassat med tanke på den större andelen rätt på träningsdatan. Eftersom beslutsträdet inte återskapas mer än en gång gör att det inte går att visualisera felklassifikationsandelen med samma figur som med de övriga metoderna. Andelen felklassifikationer för varje iteration är alltså inget som går att återskapa för beslutsträdet då det endast bygger på en iteration.

Bagging-metoden presterade bäst om totala antalet rätt klassificerade observationer skulle vara det enda som det togs hänsyn till. Bagging-metoden har dock en grov tendens att underskatta antalet oavgjorda matcher.

Bagging Adaboost

Predikterat

Verklig ^Bortavinst ^Oavgjort ^{Hemmavinst Hemmavinst} ^Oavgjort ^Bortavinst

Predikterat Verklig Bortavinst 21(80.8%) 10 3 3 9 17(65.4%) Bortavinst

Oavgjort 3 7(21.8%) 4 6 12(37.5%) 8 Oavgjort Hemmavinst 2 15 30(81.1%) 28 (75.7%) 11 1 Hemmavinst

Tabell 5 - Tabell som beskriver hur många hemmavinster, bortavinster och oavgjorda matcher med prediktion respektive de verkliga resultaten. De gröna fälten beskriver de rättklassificerade matcherna.

I tabell 5 presenteras även den rättklassificerade andelen för de olika klasserna producerade av adaboost och bagging-metoderna. Eftersom att dessa två metoder presterade jämnbra, 60 % respektive 61.2% rättklassade slutresultat. Därmed undersöks vidare endast hur bra dessa metoder var på att få rätt på de tre olika klasserna.

Adaboost-metoden är sämre på att klassificera hemmavinst och bortavinst gentemot bagging-metoden. Dock är bagging-metoden väldigt dålig på att klassificera oavgjort. Den har svårt för att klassificera en oavgjord match då den totalt predikterar 14 oavgjorda matcher när det egentligen är 32 oavgjorda matcher i testdatan. Adaboost-metoden klassar hela 26 matcher

som oavgjorda, dock klassas endast 12 rätt. Alltså har bagging-metoden en tendens att överskatta antalet hemmavinster och bortavinster. Som konsekvens får metoden fler

rättklassificerade matcher inom dessa två klasser. Adaboost-metoden varken överskattar eller underskattar någon klass och ändå presterar den endast 1.2 procentenheter sämre än bagging-metoden över alla tre klasser. Därför anses adaboost-bagging-metoden vara den bästa fastän den har en lite högre andel felklassifikationer än bagging-metoden.

Adaboost-metoden är den valda metoden och 60 % av slutresultaten klassificerades rätt med dessa variabler. Målet med undersökningen var att förklara vilka av dessa variabler som är viktigast för att förklara framgång. I tabell 6 presenteras en tabell som rangordnar de viktigaste variablerna. Variablernas betydelse är definierat som ett medelvärde på antal felklassificerade observationer för varje iteration ifall den valda variabeln hade exkluderats, notera att det endast är 57 rätt klassificerade observationer.

Nr Variabel Medelminskning i rättklassificeringsantal

1 Rensning (B) 9.9534871 20 Skott zon 3 (H) 2.2135481 2 Rensning (H) 6.5584402 21 Skott zon 5 (H) 2.2020589 3 Skott på mål (H) 5.8200600 22 Spelstil (B) 2.0658208 4 Skott på mål (B) 5.2989733 23 Skott zon 4 (H) 2.0257483 5 Stora chanser (B) 5.1760515 24 Totalt antal skott (H) 1.9691497 6 % rättpassningar (B) 5.0867107 25 Skott zon 4 (B) 1.8983335 7 Hörnor (H) 3.9967889 26 Skott zon 5 (B) 1.7653063 8 % rättpassningar (H) 3.8436126 27 Skott zon 3 (B) 1.5584613 9 Bollinnehav (H) 3.5992318 28 Spelstil (H) 1.5329381 10 Offside (B) 3.3954700 29 Skott zon 1 (B) 1.2558536 11 Missade skott (H) 3.2336631 30 Misstag (H) 1.0662427 12 Missade skott(B) 2.8222742 31 Skott zon 1 (H) 0.8050820 13 Offside (H) 2.7497202 32 Misstag (B) 0.7804362 14 Totalt antal skott ((B) 2.6530265 33 Straff (B) 0.6868382 15 Blockade skott (B) 2.6271304 34 Bollinnehav (B) 0.6830668 16 Blockade skott (H) 2.4118269 35 Rött kort (B) 0.6750940 17 Stora chanser (H) 2.3784307 36 Straff (H) 0.3432073 18 Skott zon 2 (H) 2.3339202 37 Rött kort (H) 0.2065927 19 Skott zon 2 (B) 2.3274035

Tabell 6 - Medelminskning i rättklassificeringsandel, variablerna är sorterade över hur betydelsefulla de är för adaboost-metoden

Rensningar är inte endast den viktigaste försvarsvariabeln utan också den viktigaste variabeln för att förutspå slutresultat i den valda modellen. Detta tyder på att antal rensningar är den viktigaste prestationsvariabeln. Detta kan möjligtvis vara en variabel som kan användas mer inom prediktionsmodeller. Många sådana modeller är baserade på ”förväntat antal mål” och ”förväntat antal insläppta mål”. Dessa modeller är då byggda på antal mål och insläppta mål eller i vissa fall antal avslut från olika zoner och på olika sätt (nick, volley, frispark), men sällan är dessa modeller baserade på försvarsvariabler som rensningar eller blockade skott. Resultatet i denna analys är en stark indikation på att rensningsvariabeln kan och bör användas för att prediktera antal mål. Då slutresultat förklaras av antal gjorda och insläppta mål bör denna variabel också vara användbar för framtida prediktionsmodeller.

Många rensningar har en positiv inverkan på slutresultatet. Ifall ett lag har rensat mer är det i genomsnitt ett tecken på att laget har presterat bättre. Ifall rensningsvariabeln för bortalaget hade tagits bort hade modellen i genomsnitt predikterat 9.95 matcher fel för varje iteration. Om rensningsvariabeln för hemmalaget hade exkluderats från modellen hade i genomsnitt 6.55 matcher predikterats fel för varje iteration.

Blockade skott är den sista av våra två försvarsvariabler. Den är dock inte lika viktig som antal rensningar enligt denna analys. Tillsammans sänks den genomsnittliga minskningen av rättklassificerade matcher med 2.6 respektive 2.4 för varje iteration ifall dessa variabler exkluderats separat. Denna variabel har en negativ påverkan ifall värdet ökar. Alltså har lag som blockat många skott en tendens att förlora matcher. Under en match är det självklart positivt att blocka ett skott från det försvarande lagets synvinkel. Men om det försvarande laget är i en situation där de har varit tvungna att blocka många skott har de förmodligen varit tillbakapressade och att motståndarlaget förmodligen varit nära att få igenom många skott. Det är nog detta som indirekt fångas upp med variabeln då det egentligen är positivt att blocka skott.

Den näst viktigaste prestationsvariabeln är antalet skott på mål. Detta är inget oväntat och ett ganska förväntat resultat. Förväntat antal mål-modeller brukar vara konstruerade kring denna variabel. Problemet med denna är att den inte tar hänsyn till avslutarens omgivning. Stora chanser är en avslutsvariabel som tar hänsyn till hur omgivningen sett ut vid avslutet. Som väntat är detta också en viktig prestationsvariabel. Det är dock viktigare för bortalaget att ha fler stora chanser än vad det är för hemmalaget. Andelen rätt slagna passningar är också en viktig prestationsvariabel. Lag med högre andel rätt slagna passningar har en tendens att vinna fler matcher. Detta är också något som kan tyckas vara självklart.

Bollinnehavet är en prestationsindikator som är viktig för hemmalaget men mindre viktig för bortalaget. Detta är den enda prestationsvariabeln som beter sig olikt ifall det är hemmalaget eller bortalaget som har ett högt eller lågt värde. Högre bollinnehav har då en positiv inverkan på resultatet. Den genomsnittliga rättklassifikationen minskar med 3.59 matcher för varje iteration ifall variabeln som förklarar bollinnehav för hemmalaget exkluderas. Men om samma variabel exkluderas för bortalaget minskar medelrättklassificeringsandelen med bara 0.68 matcher för varje iteration. Enligt denna analys är det alltså viktigt att ha högt

bollinnehav för hemmalaget dock är det inte lika viktigt för bortalaget. Detta kan bero på inställningen för de olika lagen. Hemmalag brukar oftast gå in i en match och försöka vinna den, vilket leder till att de bör spela med ett högre bollinnehav. Bortalag kan vara nöjda med ett oavgjort slutresultat och spela mer konservativt i anfallsspelet. Det är också vanligt att bortalagen spelar kontringsfotboll, vilket kan vara orsaken till varför bollinnehav är en oviktig prestationsvariabel för ett bortalag.

Av de fasta situationerna är antal hörnor den viktigaste prestationsvariabeln. Under senare tid har hörnor blivit en ”döende konst” inom fotbollen. Endast 2.65% av hörnor i Premier League resulterade i direkta mål 14-15 (ESPN, 2015). Denna analys är en indikation på att fastän hörnor inte resulterar i direkta mål är det ändå en viktig variabel för att förutspå slutresultat. Det tyder på att hörnor ändå har en underliggande relation med det vinnande laget då flera hörnor har en positiv påverkan för både hemma- och bortalagen. Det kan bero på att lag med

fler hörnor också är lag som har fler skott på mål eller att lag med fler hörnor oftast är lag som agerar mer offensivt under matcherna.

Mindre viktiga prestationsvariabler är spelstil, totalt antal skott från hemmalaget, misstag och skott från zon 1,3,4,5. Variablerna röda kort, straff och misstag har också definierats som icke viktiga enligt denna modell. Trots detta kan de vara viktiga variabler men eftersom att det sker sällan ändras det inte särskilt mycket ifall dessa variabler skulle exkluderats ur analysen. Variablerna blir alltså lidande med betydelsemåttet som används. Detta är en av nackdelarna med att definiera betydelsen av variablerna med måttet medelminskningen i antalet

rättklassificeringar vid exkluderandet av en variabel. Potentiellt sett kan ett rött kort under en match också leda till förändringar bland övriga variabler. Med ett rött kort har plötsligt ett lag en person färre på planen och detta kommer ändra förutsättningarna för hur övriga variabler reagerar. Därför finns möjlighet till att den variationen plockas upp av dessa variabler.

Prediktionsvariabler

Här undersöks samtliga variabler som presenterats under data-avsnittet i uppsatsen(ekvation 18). Målet med denna del av undersökningen är att hitta de variabler som är bäst på att prediktera slutresultat och sedermera bygga en prediktionsmodell med dessa. Alltså har inte endast prestationsvariabler undersökts utan också variabler som kan representera de olika lagens kvalitet.

Figur 10- Figur som beskriver andelen felklassifikationer för varje iteration för ensemblemetoderna. Notera att Y-axlarna är olika stora och i random forest-metoden (uppe till vänster) är den svarta linjen den som representerar andelen

felklassifikationer. % rättklassificerad träningsdata % rättklassificerad testdata Slumpade variabler Iterationer Bootstrap Storlek Beslutsträd _90.5% _78.9% _- _- _- Bagging _100% _87.4% _samtliga ₂₀₀ _60% Random Forest _100% _88.4% ₆ ₅₇₆ _60% Adaboosting _100% _90.5% _- ₂₀₆ _-

Tabell 7 - Tabell över hur samtliga variabler presterade med de olika modellerna

I tabell 7 presenteras andelen felklassifikationer för varje iteration för de olika

ensemblemodellerna. Random forest-modellen har lägst andel felklassifikationer vid iteration 576. En bootstrappstorlek på 60 % och sex slumpade variabler per träd är använt för att bygga denna ensemble. Bagging-modellen har den lägsta andelen felklassifikationer vid iteration 30 och sedan håller den konstant samma låga nivå. Adaboost-modellen har sin lägsta andel felklassifikationer vid iteration 64 och 206.

Om den bästa modellen ska väljas för att prediktera slutresultat är det inte helt rätt att endast utgå från vilken modell som hade lägst andel felklassifikationer vid en iteration. När en prediktion sker och slutresultaten inte finns till hands, kan ingen iterationspunkt hittas. Alltså måste antalet iterationer väljas innan prediktionerna görs. Därför väljs den bästa modellen baserat på hur bra de presterar i genomsnitt inom vissa iterationsramar.

Random forest-modellen presterade minst bra. Fastän denna modell hade en mindre lägsta andel felklassifikationer än bagging-modellen vid en specifik punkt behöver det inte betyda att random forest-modellen är mer konsistent.

Efter 30 iterationer blir bagging-modellen varken bättre eller, kanske till och med viktigare, sämre. Detta är en väldigt bra egenskap ifall prediktioner på slutresultat ska göras med denna modell. Dock är detta endast ett test baserat på just den aktuella tränings- och testdatan. Därmed går det inte att dra alltför generella slutsatser.

Adaboost-modellen presterar också bra, mellan iteration 180 och 380 fluktuerar andelen felklassifikationer häftigt mellan 10.5 % och 12.5 %. Vilket är den i genomsnitt bäst presterande modellen. Mellan dessa ramar når andelen felklassifikationer som lägst vid iteration 206. Vid denna iteration är andelen felklassifikationer nere vid 9.5%. Detta innebär att modellen bör utföras med ett iterationsnummer mellan 180 och 380 för att prediktera slutresultat med dessa variabler.

Adaboosting

Predikterat/Verklig Bortavinst Oavgjort Hemmavinst Bortavinst 23(88.5%) 4 0

Oavgjort 3 26(81.3%) 2

Hemmavinst 0 2 35(94.6%)

Tabell 8 - Resultatet från adaboost-metoden med samtliga variabler. De gröna fälten representerar rättklassificerade matcher.

I tabell 8 presenteras en prediktion med en iteration som ligger mellan 180 och 380. Just denna prediktion är den mest förekommande mellan dessa iterationer. En annan specifik prediktion kan både vara bättre och sämre men inte vanligare. Modellen är bra på att klassificera samtliga klasser med en total rättklassificeringsandel på 88.4%.

Detta betyder att med denna modell, ifall samtliga variabler gissas korrekt och den vanligaste iterationen mellan iteration 180 och 380 är vald, klassificeras slutresultat rätt 88,4 % av gångerna. Eftersom att det är 46 variabler i modellen är chansen inte stor att samtliga variabelvärden får den korrekta vid en gissning. Därför är det intressant att undersöka vilka variabler som modellen uppskattar som betydelsefulla och därför finns möjligheten att bygga en prediktionsmodell med de viktigaste variablerna.

36 Nr Variabel Medelminskning i rättklassificeringsantal 1 Spelarbetyg (H) 25.46823446 2 Spelarbetyg (B) 25.00149436 3 Oavgjort odds 4.37971801 4 Antal missade skott (B) 2.65058385 5 Stora chanser (B) 2.47150186 6 Hemmavinst odds 2.43022285 7 Rensningar (B) 2.40065514 8 Domare 2.39843158 9 % rättpassningar (H) 2.12769372 10 Skott på mål (B) 1.97406563 11 Rensningar (H) 1.93738953 12 % rättpassningar (B) 1.88715741 13 Avslut zon 2 (H) 1.80270693 14 Bollinnnehav (H) 1.78593337 15 Avslut zon 2 (B) 1.69172401 16 Antal missade skott (H) 1.64317799 17 Offsides (B) 1.58590108 18 Offsides(H) 1.29731477 19 Antal blockade skott (H) 1.10383814 20 Skott zon 4 (B) 1.00039329

Tabell 9 - Tabell över medelminskning i rättklassificeringsantal med de 20 viktigaste variablerna för adaboost-metoden

I tabell 9 presenteras de tjugo viktigaste variablerna som diskriminerar slutresultat vid utförandet av adabooost-modellen. De är mätta med måttet medelminskning av antal

rättklassificerade matcher vid exkluderandet av just den specifika variabeln. Detta betyder att ifall en specifik variabel exkluderas kommer modellen att klassificera fler fel och antalet fler fel ges av tabell 9. Samtliga variabler undersöktes men tabell 9 presenterar endast de variabler som i genomsnitt skulle sänka antalet rättklassificerade matcher med minst en hel match. Målet med prediktionsmodeller är att med så få variabler som möjligt få så många

rättklassificerade prediktioner som möjligt. För varje variabel måste det göras en kvalificerad gissning som ska gå ihop med verkligheten. I modellen används 46 variabler. Alltså måste 46 värden gissas rätt för att klassificera 88.4% av matcherna rätt. Samtliga variabler är dock inte lika viktiga för att prediktera slutresultaten med. Därför är det mer betydelsefullt att gissa rätt på de viktigare variablerna då de har större effekt på slutprediktionen.

Först observeras det att modellen föredrar bortavariabler över hemmavariabler, av de tio viktigaste variablerna är fem bortavariabler och två hemmavariabler. Av de använda

prestationsvariablerna är antal rensningar fortfarande en av de viktigare variablerna. Detta är ännu en stark indikation på att antal rensningar är en bra prestationsvariabel för ”Förvänt antal insläppta mål”-modeller.

Sju av de tjugo viktigaste variablerna är avslutsvariabler. Totala antalet stora chanser för bortalaget och antalet missade avslut för bortalaget är viktigast. Två av de tio viktigaste prediktionsvariablerna är oddsvariabler. Detta är bekvämt då det inte behövs några gissningar bland dessa variabler. Det är variabler som finns tillgängliga innan matchen.

Spelarbetygsvariabeln för hemma- och bortalagen är de överlägset viktigaste variablerna för adaboost-modellen. I genomsnitt hade 25.5 respektive 25.0 rättklassificerade matcher

felklassificerats ifall dessa variabler exkluderats separat. Det är en felklassifikationesandel på 30.3% och 29.8%.

Domaren är en av de viktigare variablerna att prediktera slutresultat med. Ifall denna variabel hade exkluderats hade 2.39 matcher i genomsnitt för varje iteration missklassificerats. Det är en missklassifikationsandel på 2.84% och är den sjunde viktigaste variabeln som predikterats med. Vilken domare som dömer en match kan tolkas som viktigare än hemmalagets

bollinnehav, avslut från zon två av bortalaget eller andelen rättslagna passningar av hemmalaget. Den valda domaren har alltså en större påverkan på slutresultatet än 37

prestationsvariabler för de två olika lagen enligt modellen. Endast de två lagens spelarbetyg, antal missade skott, antal stora chanser och antal rensningar av bortalaget har en större påverkan på matchresultatet än domaren som dömer.

Det är väldigt intressant att domaren blev en av de viktigare variablerna att prediktera med. Alltså är den valda domaren på förhand en betydande faktor vid diskriminering av slutresultat. Innan några hastiga slutsatser dras är det värt att granska denna variabel och förstå hur

adaboost-metoden tolkar den.

Domare HemmaV Oavgjort BortaV Domare HemmaV Oavgjort BortaV

Marriner 10 5 3 Dean 8 6 7 Taylor 11 3 10 Jones 13 9 2 Pawson 8 12 3 Oliver 8 3 8 Scott 1 0 2 Swarbrick 5 4 4 Moss 7 4 4 Tierny 0 2 0 Friend 1 0 0 East 9 6 8 Stroud 5 3 8 Madley 11 4 5 Mason 8 2 9 Attwell 0 0 1 Atkinson 8 3 10 Hooper 0 0 1 Clattenburg 7 9 5

Tabell 10 - Fördelningen över hur de olika domarna har dömt i sina respektive matcher

I tabell 10 presenteras samtliga domare och slutresultaten på de matcher de har dömt. Denna tabell presenterar endast observationer i datasetet. Med andra ord är adaboost-modellen byggd på dessa observationer. För att förstå varför domarvariabeln blev så betydande måste den domaren som dömer en specifik match sammankopplas med resterande variabler.

Då ensemble-modellen är byggd på träningsobservationerna måste testobservationerna stämma samman med träningsobservationerna för att variabeln ska bli betydande. Ifall träningsobservationerna förklarar en stark positiv relation mellan antal stora chanser för hemmalaget och hemmavinst kommer en adaboost-modell konstrueras med antal stora chanser för hemmalaget som en av de mer betydande variablerna. Om sedan denna variabel också har en stark positiv relation med hemmavinst bland testobservationerna kommer variabeln att ha en hög siffra för medelminskning i rättklassificeringsandel. Detta är då en stark indikation på att fler stora chanser för hemmalaget diskriminerar hemmavinst.

Om denna teori överförs från antal stora chanser för hemmalaget till domarvariabeln blir det klart att slutresultatet i de matcher som dessa domare har dömt i träningsobservationerna har

en tendens att bli lika i testobservationerna, i samband med resterande variabler. I tabell 10 presenteras slutresultat på de matcher som Taylor och Marriner har dömt bland

träningsobservationerna. Marriner har en tendens att döma fler hemmavinster medan Taylor

In document Analys av prestations- och prediktionsvariabler inom fotboll (Page 28-43)