Vad styr priset på Magic: the Gathering kort?
Författare: Rebecka Klang (950225) och Eldin Velic (911213)
VT20
Uppsats, kandidat, 15hp Ämne: Statistik
Handelshögskolan vid Örebro universitet Handledare: Stepan Mazur
Tack
Vi vill tacka Brian (Manath) som äger och utvecklar databas-hemsidan MTG Collection Builder. Han hjälpte oss att hämta datamaterialet från Scryfall.com och det är vi väldigt tacksamma över.
Sammanfattning
I denna uppsatsen undersöktes vilka variabler som styr priset för Magic: The Gathering kort. Datamaterialet började med 45843 observationer (kort) och tusentals variabler, medräknat alla dummyvariabler och bearbetades ner till 40757 observationer och 497 variabler. Därifrån användes LASSO (“least absolute shrinkage and selection operator”) som gav en modell med 25 variabler, där 12 av dem var olika set korten släppts i och 7 som handlade om vilka format korten var tillåtna eller förbjudna att spelas i. Slutligen diskuterades variablerna i modellen och möjliga felkällor togs upp.
Innehållsförteckning
1 Inledning... 1
1.1 Syfte och frågeställning ... 1
1.2 Disposition ... 1
2 Bakgrund ... 2
2.1 Format och spelregler ... 2
2.2 Olika typer av kort ... 3
2.3 MTG’s olika färger ... 5
2.4 Berättelsen i MTG ... 5
2.5 Tidigare studier ... 6
3 Data... 7
3.1 Bearbetning ... 8
3.1.1 Borttagning ... 8
3.1.2 Pris ... 9
3.1.3 Format ... 10
3.1.4 Set ... 11
3.1.5 Diverse ... 11
3.2 Efter bearbetning ... 12
4. Metod ... 14
4.1 Lasso ... 14
4.2 Cross-Validation ... 15
5 Resultat ... 16
6 Diskussion ... 18
6.1 Möjliga felkällor ... 20
6.2 Möjliga förbättringar ... 21
7 Referenslista ... 22
8 Appendix ... 24
1
1 Inledning
Richard Garfield, Ph.D., skapade Magic: The Gathering (MTG) och 1993 släpptes korten för första gången och var slutsålda inom en månad (Rosewater 2013). Samlingsbara kort var inget nytt och inte heller kortspel men MTG var först med att kombinera samlingsbara kort med att konstruera sina egna lekar att spela med (Rosewater 2006). Med årens gång har fler samlarkortspel dykt upp, både fysiskt och online, t.ex. Pokémon Trading Card Game och Hearthstone. Företaget som äger MTG är Wizards of the Coast (WotC) som skapades 1990 av Peter Adkison och hans vänner i Adkisons källare (Rosewater 2013). Idag ägs WotC av Hasbro som köpte upp företaget 1999. MTG har även ett antal Guinness World Records, bl.a. första moderna samlarkortspel och mest spelade samlarkortspel (Ashley 2011).
1.1 Syfte och frågeställning
Frågeställningen som ska besvaras i denna uppsatsen är vilka variabler som har störst inverkan på priset på individuella MTG kort. MTG är ett samlarkortspel där vissa kort är värda flera tusentals kronor medan andra bara är värda ett par kronor. Skillnaden förväntas uppstå av flera olika faktorer och denna uppsatsen ska försöka finna vilka variabler som har störst inverkan.
1.2 Disposition
Andra avsnittet förklarar grunderna med MTG och olika termer. Tredje avsnittet går igenom bearbetningen av datamaterialet. Fjärde avsnittet beskriver de metoder som används för att få fram resultatet som presenteras i femte avsnittet. Slutligen i sjätte avsnittet diskuteras resultatet och möjliga felkällor och förbättringar tas upp.
2
2 Bakgrund
2.1 Format och spelregler
I MTG finns det olika format att spela, som går att dela upp i olika kategorier (Magic the Gathering u.å.1). De format som har fokuserats på i denna uppsats ingick i kategorin Constructed där man konstruerat sin egen fysiska lek i förväg medan andra kategorier använder en mer randomiserad samling av kort och konstruerar lekarna på plats, Limited, eller körs endast online. De flesta Constructed och Limited format går även att spela online. De olika formaten har regelskillnader som visas i Tabell 1.
Tabell 1: Regelskillnader i olika Constructed format
Format Liv man
startar med Antal kort i leken Max antal kopior per kort Antal spelare Standard 20 minst 60 4 2 Pioneer 20 minst 60 4 2 Modern 20 minst 60 4 2 Legacy 20 minst 60 4 2 Pauper 20 minst 60 4 2 Vintage 20 minst 60 4 2 Commander 40 100 1 2-6 Brawl 25/30 60 1 2-6 Duel Commander 20 100 1 2 Old School 93/94 20 minst 60 4 2
Vilka kort som är tillåtna i de olika formaten varierar (Magic the Gathering u.å.1). Standard och Brawl tillåter kort från specifika set som släpps fyra gånger per år. En gång om året roterar de fyra äldsta seten ut för att göra plats för de kommande seten vilket innebär att en rotation innehåller 4-8 set. Pioneer tillåter kort som någon gång varit tillåtna i Standard fr.o.m. setet Return to Ravnica, som släpptes 2012, och framåt. Modern tillåter kort som är släppta i setet Eighth
Edition, som släpptes 2003, och framåt. Legacy, Vintage, Commander och Duel Commander är alla format som tillåter kort
3 från alla set, där Vintage förbjudit färst antal kort. Pauper tillåter kort som blivit släppta med rariteten Common, som är de vanligaste korten att få när man öppnar en förpackning. De andra rariteterna är, i ordning, Uncommon, Rare och Mythic Rare där Mythic Rare är de mest sällsynta att få i en förpackning. Old School 93/94 tillåter endast kort som blivit släppta under 1993 och 1994, d.v.s. de första åren som MTG existerade.
I de flesta format så får det endast förekomma fyra kopior av samma kort men det finns undantag. Vissa av formaten har en lista med begränsade kort som det max får vara en kopia av i leken och/eller en lista med förbjudna kort som inte alls får spelas i formatet. Basic
Lands är ett annat undantag. Alla format tillåter ett obegränsat antal
med Basic Lands. I formaten Commander, Brawl och Duel
Commander så ska också ett av korten vara en general, som oftast
är av typen Legendary Creature och som startar utanför spelet och kan spelas in när som helst under spelets gång. Det är oftast
generalen som leken centrerar runt.
Alla format inleder spelet med att alla spelare drar sju kort varpå varje spelare får göra ett val om de vill behålla sina kort eller dra nya. Om spelaren väljer att dra nya kort drar de istället sex kort och om de väljer att upprepa processen drar de istället fem kort o.s.v. (Magic the Gathering u.å.2). När alla spelare är nöjda med korten de dragit så spelas MTG i turer där varje spelare drar ett kort i början av sin tur och spelar de kort hen vill och kan spela innan det är nästa spelares tur.
Det finns flera olika sätt att vinna spelet på. Det vanligaste sättet är att motståndarens liv går ner till 0, oftast genom att tillräckligt många
Creatures har attackerat den. Ett annat sätt är att när motståndaren
ska dra ett kort finns det inga kort kvar i leken. Detta uppnås lättast genom att få motståndaren att kasta kort från leken till gravhögen, som är den plats där kort som inte längre är i spel hamnar. Det finns även alternativa sätt att vinna spelet på där vissa kort har kriterier och om dessa är uppfyllda vinner man spelet direkt. Exempel på sådana kort är Felidar Sovereign som har kriteriet att om man har 40 eller mer liv i början av sin tur så vinner man spelet eller Laboratory
Maniac som säger att om man själv drar kort när ens lek har slut på
kort så vinner man spelet. 2.2 Olika typer av kort
Alla kort går att dela upp i kategorierna Permanents och
Non-permanents (Magic the Gathering u.å.2). Permanents är som
namnet låter, mer permanenta, d.v.s. de stannar på brädet efter att de spelats och kan ha återkommande effekter. Non-permanents har
4 oftast engångseffekter och hamnar i gravhögen direkt efter att de har spelats. Varje kort har minst en huvudtyp och ingen, en eller flera supertyper och/eller undertyper. I Tabell 2 och 3 finns de huvudtyper respektive supertyper och undertyper som denna uppsats fokuserat på.
Tabell 2: Huvudtyper
Typ Permanent
Non-permanent Huvudtyp Land x x Creature x x Planeswalker x x Artifact x x Enchantment x x Instant x x Sorcery x x Conspiracy x x
Tabell 3: Supertyper och undertyper
Typ Supertyp Undertyp
Basic x
Legendary x
Snow x
Equipment x
Aura x
Alla kort har en Converted Mana Cost (CMC) vilket är den totala mängd Mana som behövs för att kunna spela ut det kortet. Lands är de kort som producerar Mana och de har en CMC på noll. En noterbar supertyp för Lands är Basic. Basic Lands ger endast en specifik färg och har inga andra effekter, såsom vissa andra Lands kan ha.
Det finns flera andra supertyper och undertyper. Bara för huvudtypen Creature så finns det 251 undertyper (Magic the Gathering u.å.2). Creatures är varelser som huvudsakligen används
5 för att attackera motståndare eller Planeswalkers och för att blockera andra Creatures. Planeswalkers har flera effekter som spelaren kan välja mellan och endast en effekt får göras per tur.
Artifacts och Enchantments är båda Permanents som har antingen
passiva eller aktiva effekter, oftast återkommande. Equipment är en undertyp för Artifacts och Aura är en undertyp för Enchantments. Båda dessa undertyperna används oftast för att ge Creatures effekter där en skillnad mellan dem är att Equipments går att förflytta mellan olika Creatures till en extra kostnad. Auras går däremot ibland att sätta på andra Permanents än bara Creatures.
Instants och Sorceries är kort med engångseffekter. Skillnaden
mellan dem är att Instants kan spelas när som helst medan
Sorceries endast får spelas på spelarens egen tur. Conspiracy är
kort som endast är tillåtna i formatet Conspiracy Draft som tillhör kategorin Limited. Dessa befinner sig utanför spelet och har aktiva eller passiva effekter som ofta är återkommande under hela spelets gång.
Legendary är kort som har en koppling till berättelsen som utspelar
sig över alla korten, t.ex. en specifik karaktär eller artefakt. Snow är en supertyp som kan finnas på flera olika typer av Permanents och som ibland hänvisar till andra Snow Permanents.
2.3 MTG’s olika färger
Alla kort i MTG har en Color Identity som enkelt förklarat innebär vilka färger som kortet har (Magic the Gathering u.å.2). De olika färgerna i MTG är vit, blå, svart, röd och grön. Ett kort kan även vara färglös. Alla färger går också att kombinera med varandra och alla färger har även en grundläggande betydelse och blir som ett överhängande tema över alla korten i den färgen. Vit står för moral och ordning och söker fred genom struktur. Blå står för kunskap genom teknologi och logik. Svart söker makt genom hänsynslöshet eller möjligheter. Röd står för impuls och kaos och söker frihet genom handling. Grön är naturens färg och står för instinkt och ömsesidigt beroende. I spel kan man märka de olika kortens tema, t.ex. har grönt väldigt lätt att få fram mycket Lands och har stora
Creatures medan blå fokuserar mer på att dra fler kort och lägga Instants och Sorceries.
2.4 Berättelsen i MTG
Korten i MTG är inte bara en hög av kort med olika effekter utan en del berättar även en historia som sträcker sig över många tusentals år och som berättar om olika händelser i Multiverset. Multiverset består av många olika Planes och dessa Planes kan förklaras som
6 olika världar. Det finns ett antal personer som kan vandra mellan dessa olika Planes och dessa kallas för Planeswalkers och kan jämföras med kraftfulla trollkarlar. När man spelar MTG så föreställer alla spelare Planeswalkers men det finns även kort med typen
Planeswalker som visar olika karaktärer som går att finna i MTG’s
långa historia. Andra karaktärer och artefakter som är kopplade till berättelsen har supertypen Legendary. Enligt Crutcher (2017) bör alla noveller, artiklar, kort och allt där MTG’s berättelse dykt upp ses som litterära, även om de inte alltid kan klassas som litteratur. 2.5 Tidigare studier
MTG är något som olika personer har studerat ur olika vinklar dock hittades ingenting som handlade om samma ämne som denna uppsats. Här följer några exempel på artiklar som har med MTG att göra. Martin (2004, 2019) har undersökt hur konsumenters upplevelse av spelet påverkas av fantasytemat som MTG har och hur konsumenterna använder sig av sin fantasi. Cowling, Ward och Powley (2012) använde MTG för att undersöka hur väl Monte Carlo
tree search funkar för AI på spel med asymmetrisk information, d.v.s.
alla spelare har inte samma information då de inte vet vilka kort som är i varandras händer eller vilket kort som kommer dras. Reiley (2006) använde MTG för att undersöka hur auktionerare betedde sig med manipulerade minimumbud.
7
3 Data
Datamaterialet hämtades från Scryfall.com den 4 april 2020 och innehöll totalt 45843 observationer (unika kort) med 67 variabler. En del variabler gav samma eller liknande information och därför presenteras variablerna som fanns tillgängliga i datamaterialet grupperat enligt Tabell 4 nedan.
Tabell 4: Variabler före bearbetning
Variabel Antal
ID-variabler som var unika för varje observation 21 Variabler som beskrev hur ett kort är utformat 13 Variabler där alla observationer antog exakt samma värde 5
Irrelevanta variabler 4
Variabler som gav information om vilket set kortet släpptes i
3
Variabler som endast innehöll information för specifika korttyper
3
Variabler som innehöll information om vilken färg ett kort har
3
Variabler som angav kortets Mana-kostnad 2
Kortets namn 1
Vilken set-typ kortet tillhörde 1
Hur sällsynt kortet är 1
Information om vem som har illustrerat bilden på kortet 1 Rangordnad variabel efter popularitet i formatet
Commander
1
Textsträng med information om kortets status i olika format
1
Textsträng med information om kortets pris i olika valutor eller utföranden
1
Kortets huvudtyp och eventuella supertyp(er) och/eller undertyp(er)
8 Dummyvariabel om kortet var en ny upplaga av en
tidigare version
1
Dummyvariabel om kortet är med på Reserved list 1 Dummyvariabel om kortet endast fanns på MTG:s digitala plattformar
1
Dummyvariabel om kortet visade en viktig händelse ur berättelsen
1
Dummyvariabel om kortet gick att erhålla i en förpackning 1
3.1 Bearbetning
3.1.1 Borttagning
För att hantera den stora mängden variabler togs inledningsvis alla 4 irrelevanta variabler bort. Tre av variablerna som klassificerades som irrelevanta var om kortets illustration fanns tillgängligt online i hög upplösning, ändrad regeltext enligt errata och information om vilka plattformar kortet fanns tillgängligt på. Den fjärde irrelevanta variabeln var en textrad som återfinns på en del kort som inte är relevant för reglerna eller spelandet utan oftast bara är ett citat från en karaktär eller en händelse ur berättelsen.
Vidare uteslöts alla 21 ID-variabler med unika värden eftersom alla dessa var nycklar för hemsidan där de var hämtade och gav således ingen ytterligare information. De 5 variabler där alla observationer antar samma värden uteslöts också då det inte fanns någon variation mellan observationerna. Vidare exkluderades alla tre variabler som endast innehöll data för specifika korttyper. Dessa variabler var Power och Toughness som endast fanns för huvudtypen Creatures samt Loyalty som endast fanns för huvudtypen Planeswalkers. Variablerna exkluderades p.g.a. att saknade värden inte kunde hanteras på ett rimligt sätt.
Då det fanns flera variabler som berörde vilket set kortet släpptes i, vilken färg kortet hade och Mana-kostnaden så behölls en variabel av vardera kategori och resterande uteslöts. Namnet på kortet och illustratören till kortet uteslöts också eftersom dessa var faktorvariabler med många nivåer, 20111 och 797 respektive. Att inkludera dessa variabler i den fulla modellen hade tagit för lång tid eftersom det hade skapats en dummyvariabel för varje nivå.
Eftersom endast de fysiska korten var intressanta i denna undersökning exkluderades även variabeln digital, som var en
9 dummyvariabel som kontrollerar för om korten strikt fanns på MTG:s digitala plattformar. Således exkluderades även de observationer som berörde kort som endast förekom digitalt. Slutligen togs fyra variabler bort som berörde utformning av kort eftersom det saknades en förklaring vad variablerna avsåg. Dessa variabler var card_faces,
frame_effects, watermarks och promo_types.
3.1.2 Pris
Responsvariabeln pris behövde bearbetning då datamaterialet innehöll standardpriset i amerikanska dollar (USD), priset för folierat i USD, pris i euro (EUR) och digitalt pris (tix) för samma kort. Först och främst behövde priserna separeras då de inledningsvis låg under samma variabel. Efter separeringen valdes USD som huvudsaklig valuta då den innehöll färst saknade värden.
Folierade har ett holografiskt utseende och anses generellt vara mer värdefulla än deras ofolierade motparter då det generellt finns färre folierade. För kort som endast fanns i folierat valdes priset för folierat i USD annars valdes standardpriset (ofolierat) i USD. Vissa kort saknade pris i USD men hade pris i EUR och för dessa kort multiplicerades priset med 1,08 som enligt XE (2020) var växelkursen mellan EUR och USD den 4 april 2020, för att få med så många observationer som möjligt av responsvariabeln. Till sist fanns vissa kort endast som digitala utgåvor och hade således endast pris i tix, dessa kort uteslöts helt då endast fysiska kort var intressanta i undersökningen.
Kort som saknade värde för USD, folierat USD och EUR uteslöts från modellen eftersom inget godtagbart sätt att hantera bortfallet kunde identifieras. Det berörde totalt 1352 observationer. I Tabell 5 nedan kan medelvärde, standardavvikelse, minimumvärde, maximumvärde samt värde på decilerna p10 till p90 åskådas för
responsvariabeln.
Tabell 5: Deskriptiv statistik för responsvariabel pris (USD).
Medelvärde 10,25
Standardavvikelse 185,55
Minimum 0,01
P10 0,06
10 P30 0,12 P40 0,16 Median (P50) 0,22 P60 0,32 P70 0,59 P80 1,47 P90 4,90 Maximum 18200,16
3.1.3 Format
Datamaterialet innehöll information om vilken status respektive kort hade i 13 olika format, där de olika statusarna var tillåtna, otillåtna, förbjudna och begränsade. Formaten Penny Dreadful och Historic är format som endast förekommer online och uteslöts därför. Även
Future Standard uteslöts p.g.a. att det inte är ett format utan snarare
ett begrepp för att veta vilka kort som kommer ingå i kommande rotation av formatet Standard.
Tabell 6: Status för olika format
Format Tillåtet Otillåtet Förbjudet Begränsat
Standard x x x Pioneer x x x Modern x x x Legacy x x x Pauper x x x Vintage x x x x Commander x x x Brawl x x x Duel Commander x x x x Old School 93/94 x x x x
11 Variabeln för formaten var från början konstruerad som en textsträng med status för varje format men delades upp i 23 dummyvariabler beroende på status i vardera format. Eftersom alla 10 återstående format hade en lista över kort som var tillåtna, otillåtna och förbjudna för formatet så uteslöts dummy för otillåtna kort för varje format så att multikollinearitet kunde undvikas. I Tabell 6 ovan presenteras vilka statusar som fanns för varje format.
Kort som var otillåtna för ett format kunde man av olika anledningar inte ha med i en lek, t.ex. formatet Modern som endast tillåter kort från ett visst set och framåt. Vissa kort kunde vara tillgängliga för ett format men förbjudits av WotC av diverse anledningar, t.ex. för att de ansetts vara för starka enligt WotC, därför hade de flesta format en lista över förbjudna kort. Till sist var det endast ett fåtal av formaten som hade en lista med begränsade kort, dessa kort hade istället för att förbjudits helt begränsats till max ett kort per lek.
3.1.4 Set
WotC släpper kort i omgångar och varje samling av kort kallas för ett set. Vid varje nytt set släpps det oftast en del helt nya kort men även nya utgåvor av tidigare kort. Det finns en lista över kort som inte får göras i nya utgåvor, denna kallas för Reserved list och finns till för att de dyraste korten inte ska tappa i värde på andrahandsmarknaden (Magic the Gathering 2016).
Variabeln set var en faktorvariabel med 403 nivåer som alla representerade ett set i MTG. När datamaterialet delades in i tränings- och testdata så orsakade de set som endast hade ett eller två kort i sig problem. Detta eftersom både tränings- och testdatan behövde minst en observation av varje variabel. Därför exkluderades de 27 set som endast hade en eller två kort i sig och det berörde totalt 39 observationer.
Vidare fanns det 17 olika set-typer som varje set delades in i beroende på vad det var för typ av set. T.e.x. innefattade set-typen
Core en typ av set som släpps en gång om året och innehåller
huvudsakligen nyutgåvor av tidigare kort. Funny är ett annat exempel på en set-typ, dessa set släpps sällan och innehåller kort som inte får användas i vanliga format utan snarare kan ses som parodiska kort med unika effekter.
3.1.5 Diverse
157 av korten saknade information om färgkombination. Dessa kort fick sökas upp på Scryfall.com och den korrekta färgkombinationen fördes sedan in manuellt i datamaterialet.
12 Varje kort hade minst en huvudtyp och ingen, en eller flera supertyper och/eller undertyper. För att få med detta i modellen gjordes dummyvariabler för alla åtta aktiva huvudtyper och supertyperna Legendary och Snow. Då undertyperna var så många exkluderades alla förutom Aura och Equipment. Till sist inkluderades en dummyvariabel för kombinationen av supertypen Basic och huvudtypen Land för Basic Land.
Alla kort som var tillåtna i formatet Commander har fått en ranking efter hur populärt det kortet var i formatet. Rangordningen baserades på hur stor andel av alla lekar, uppladdade på ett par olika hemsidor, som innehöll det kortet. Alla utgåvor av ett kort fick samma delade rank, alltså baserades rankingen på hur många unika namn på kort det fanns. Det var totalt 643 unika namn som saknade rang, p.g.a. antingen att de inte används eller är förbjudna i formatet. Därför fick kort som inte hade någon ranking delad rank 19916, som var medelvärdet av de återstående rankerna.
3.2 Efter bearbetning
Från de ursprungliga 67 variabler som var tillgängliga exkluderades totalt 48 samtidigt som 36 nya dummyvariabler introducerades. Totalt blev det i datamaterialet 55 variabler och 40757 observationer efter bearbetning. 7 av variablerna som blev kvar var faktorvariabler med totalt 449 nivåer, där varje nivå blev en egen dummyvariabel. Således blev det totalt 497 variabler. I Tabell 7 nedan finns alla kvarvarande variabler representerade samt information om vilken typ av variabel det är.
Tabell 7: Variabler efter bearbetning
Variabel Variabeltyp
Pris (Responsvariabel) Numerisk
Converted Mana Cost Numerisk
Edhrec rank Numerisk, rangordnad
Folierat Dummy
Format 23 dummies
Färgkombination Faktor, 33 nivåer Går att erhålla i förpackning Dummy
13
Korttyper 13 dummies
Layout Faktor, 10 nivåer
Nyutgåva Dummy
Ofolierat Dummy
Promo Dummy
Ram Faktor, 5 nivåer
Raritet Faktor, 4 nivåer
Reserved list Dummy
Set Faktor, 376 nivåer
Set-typ Faktor, 17 nivåer
Textfritt Dummy
Utvidgad bild Dummy
14
4. Metod
För att kunna svara på frågeställningen om det går att identifiera vilka variabler som mest styr prissättningen på MTG-kort användes LASSO (“Least Absolute Shrinkage and Selection Operator”). Först delades datasetet på 40757 observationer upp i ett träningsset som innehöll 80% av alla observationer och ett testset, som innehöll resterande 20%. (James, Witten, Hastie & Tibshirani 2013)
4.1 Lasso
𝑅𝑆𝑆 = ∑ (𝑦
𝑖− 𝛽
0− ∑ 𝛽
𝑗∗ 𝑥
𝑖𝑗 𝑝 𝑗=𝑖)
2 𝑛 𝑖=1(1)
Precis som i minstakvadratmetoden (OLS) försöker LASSO ta fram en modell som anpassar sig väl till datan. Detta görs genom att hitta det värde på koefficienterna som minimerar residualkvadratsumman (RSS). I Ekv. 1 ovan kan formeln för RSS åskådas. Där är yi värdet
på responsvariabeln för alla observationer i = 1,…,n, β0 är
koefficienten för interceptet, βj är koefficienterna för alla förklarande
variabler j = 1,…,p och xij är värdet på variabel j för observation i..
Formeln för LASSO går att se i Ekv. 2 nedan där skillnaden är den andra termen. Den termen kallas för shrinkage penalty och det är den som bestämmer hur mycket koefficienterna krymps. För att kunna använda sig av LASSO behöver man först välja ett värde på λ (tuning parameter), då olika λ ger olika modeller. (James et al. 2013)
∑ (𝑦
𝑖− 𝛽
0− ∑ 𝛽
𝑗∗ 𝑥
𝑖𝑗 𝑝 𝑗=𝑖)
2 𝑛 𝑖=1 + 𝜆 ∗∑ |
𝛽𝑗|
𝑝 𝑗=1 (2)Anledningen till att LASSO valdes framför den närbesläktade metoden ridge regresson var för att LASSO utför variabelselektion, då vissa koefficienter reduceras hela vägen ner till 0. Detta överensstämmer med undersökningens syfte att identifiera de variabler som har störst inverkan på priset. Därför kunde också andra metoder som ger mer komplexa modeller med lägre tolkningsbarhet uteslutas som t.ex. principalkomponentanalys. Andra metoder som utför selektion med god tolkningsbarhet, t.ex.
best subset selection eller stepwise regression, hade varit
intressanta att använda sig av men fick uteslutas p.g.a. tidsåtgången.
15 4.2 Cross-Validation
Vid val av värde på λ-parametern används Cross-Validation (CV). Metoden som användes i detta fall var 10-fold CV, vilket innebär att datasetet slumpmässigt delas upp i 10 (om möjligt) lika stora grupper. James et al. (2013) menar att en indelning i 5 eller 10 grupper är fördelaktigt både beräkningsmässigt men även för att minimera summan av variansen och biasen och därför valdes 10. Efter uppdelningen blir en av grupperna testgrupp medan resterande blir träningsgrupper, detta upprepas till dess att varje grupp har varit testgrupp en gång (James et al. 2013). För varje testgrupp beräknas medelkvadratavvikelsen (MSE) och genomsnittet av alla gruppers MSE blir modellens skattade testfel enligt Ekv. 3 nedan. Sedan väljs det värde på lambda som ger det lägsta testfelet.
𝑇𝑒𝑠𝑡𝑓𝑒𝑙 𝐶𝑉 =
1
10
∗ ∑ 𝑀𝑆𝐸
𝑖10
𝑖=1
(3)
Eftersom indelningen i grupper är slumpartad blir modellerna olika beroende på vilka observationer som hamnar i vilken grupp (James et al. 2013). För att försöka kontrollera för slumpen så upprepades CV 100 gånger med olika gruppindelningar och genomsnittet av det λ som gav lägst testfel beräknades fram. Valet av exakt 100 iterationer var godtyckligt, troligtvis hade det räckt med färre. När λ-parametern var bestämt kunde LASSO utföras och en modell tas fram.
16
5 Resultat
Den färdiga LASSO-modellen innehöll till sist 25 variabler enligt Tabell 8 nedan.
Tabell 8: LASSO-modellens variabler och koefficienter
Variabel Koefficient
Intercept -0,58
Färg: Färglös 6,86
Reserved list 172,37
Folierat 0,26
Set: Revised Edition -21,79
Set: Alliances -0,69
Set: The Dark -0,053
Set: Homelands -0,20
Set: Judge Gift Cards 47,58
Set: Limited Edition: Alpha 210,16
Set: Limited Edition: Beta 242,67
Set: Mirage -12,63
Set: Guru 185,27
Set: Summer Magic / Edgar 135,07
Set: From the Vault: Exiled -109,21
Set: Visions -3,00 Edhrec rank -0,00023 Modern: Tillåtet 0,37 Vintage: Förbjudet -511,90 Vintage: Begränsat 94,82 Commander: Förbjudet 372,38
17
Old School 93/94: Förbjudet -64,56
Old School 93/94: Begränsat 1245,84
Typ: Sorcery -3,98
Typ: Conspiracy 45,83
I Tabell 8 ovan ses att av alla kombinationer av färger var enbart färglös med i den färdiga modellen. Utöver det var endast 12 av de 376 set och 5 av 10 format representerade i modellen. Resterande variabler som ingick i den slutgiltliga modellen var Reserved List, Folierat, Edhrec rank och de två huvudtyperna Sorcery och
18
6 Diskussion
Färglös var den enda färgkombinationen som var med i modellen med en koefficient på 6,86. Detta beror antagligen på att färglösa kort går att spela i alla lekar medan kort med specifika färger endast går att spela i de lekar som använder de färgerna. Olika färgkombinationer har olika styrkor och svagheter och dessa svagheterna kan ofta färglösa kort hjälpa till med. Grön har t.ex. som styrka att få fram mycket Lands och Mana medan de andra färgerna har svårare med det och då kan färglösa kort som får fram Lands och Mana hjälpa de övriga färgerna med det.
Kort som fanns med på Reserved list verkade ha högre pris än övriga kort enligt modellen med koefficienten 172,37. Detta är rimligt då hela idén med Reserved list är att se till att priserna inte ska sjunka. Då dessa kort inte kommer att släppas i framtiden heller är det rimligt att priset också kan öka med tiden då tillgången minskar om något av korten blir förstörda eller försvinner. Det är dock inte något vi undersökte i denna uppsatsen.
Av seten som var med i modellen var MTG:s två första set med,
Limited Edition: Alpha (210,16) och Limited Edition: Beta (242,67).
Dessa set gjordes i begränsade upplagor, vilket innebär att många av korten som fanns med är eftersökta samlarobjekt för många. Setet Guru (185,27) innehöll 5 Basic Lands som var del av en reklamkampanj år 1999 där WotC skulle rekrytera nya spelare. Dessa kort, med just de illustrationerna, har ej gjorts i några senare utgåvor och fanns därmed också i väldigt begränsad upplaga. Setet
Summer Edition / Edgar (135,07) var en uppdatering av MTG:s
tredje set Revised Edition (-21,79), som innehöll i princip samma kort men med några få modifieringar. Resterande set verkade ha en viss inverkan på priset, men inte allt för hög, med koefficienter mellan -12,63 och -0,053, förutom From the Vault: Exiled, vars koefficient låg på -109,21. Alla kort från From the Vault: Exiled var nya utgåvor att tidigare kort som var förbjudna eller begränsade i olika format. Korten som var med i det setet hade en negativ inverkan på priset som möjligtvis kan bero på att de inte fick användas att spela med i flera format.
Edhrec rank hade en negativ koefficient på -0,00023, vilket är rimligt
då kortet med bäst rank hade rank 1 och ju högre ranksiffra desto mindre populärt var kortet. Det är också rimligt att koefficienten var så låg då det inte var stor skillnad mellan t.ex. rank 156 och 157 medan det var en mer märkbar skillnad mellan rank 156 och 15600.
19 Alla format ingick inte i modellen utan bara 5 av 10. Dessa 5 var
Modern, Vintage, Commander, Duel Commander och Old School 93/94. Den med svagast koefficient av format-variablerna var tillåtna
kort i Modern med koefficienten 0,37. Anledningen till att den var med men inte tillåtna kort för t.ex. Standard eller Pioneer tros bero på att Modern har tillgång till fler kort än de formaten och därmed kan välja ut bättre kort, som då kan tänkas vara dyrare. För Vintage var både förbjudna (-511,90) och begränsade kort (94,82) med i modellen. De korten som var förbjudna i Vintage, när datan insamlades, var även förbjudna i majoriteten av format vilket kan förklara den stora minskningen på pris. Flera av korten som var begränsade däremot var bland de dyraste korten då de ofta tenderar att vara starkast. Samma princip gäller även för de förbjudna korten i Commander (372,38) och Duel Commander (219,70) då det ofta var de dyrare korten som blivit förbjudna. För Old School 93/94 däremot så var de dyra korten inte förbjudna (-64,56) utan begränsade (1245,84). Att begränsade hade en så stor positiv inverkan på priset antas bero på att en del av de dyraste korten inom MTG var på den listan. Då Old School 93/94 endast spelar med kort som släpptes de två första åren av MTG:s historia så antar vi att dessa korten är eftersökta även av samlare vilket kan tänkas öka priset ännu mer.
Kort med huvudtypen Sorcery hade en negativ inverkan på priset enligt modellen med koefficient -3,98. Det kan ha sin förklaring i att
Sorceries oftast jämförs direkt med Instants. I avsnitt 2.2 så beskrivs
det att den stora skillnaden mellan dessa typer av kort är att Instants går att spela när som helst medan Sorceries endast går att spela på sin egen tur. Detta gör att Instants blir mer attraktiva och kan tänkas förklara varför Sorcery hade en negativ koefficient.
En variabel som vi på förhand trodde skulle ingå i den färdiga modellen var Converted Mana Cost (CMC). I många format är strategin att vinna på en så tidig tur som möjligt, innan motståndaren har hunnit bygga upp ett försvar. För att det ska vara möjligt måste man kunna lägga så många bra kort som möjligt de första turerna och då behöver korten ha en låg CMC. Även om den generella strategin skulle vara att spela längre matcher och vinna matchen senare i spelet så behövs ändå kort med låg CMC för att fylla ut leken och kunna spela något under de första turerna.
Raritet var en annan variabel som vi på förhand trodde skulle ingå i modellen. Varje förpackning med kort innehåller alltid fler av
Commons och Uncommons och väldigt få Rares och Mythic Rares.
De mer sällsynta Rares och Mythic Rares har ofta bättre effekter och därmed trodde vi att de skulle spela en positiv inverkan på priset.
20 Vi kan se i modellen att huruvida kortet var spelbart eller ej i olika format hade inverkan på priset, dock antog vi även att format som
Standard skulle vara med bland dessa variabler. Detta då vi
misstänkte att format som hade tillgång till färre kort skulle öka priset på dessa korten men det visade sig enligt modellen att format som hade tillgång till fler kort påverkade priset mer. Det kan vara så att just denna rotation av Standard inte var statistiskt signifikant på priset men om man hade gjort samma undersökning för t.ex. två år sedan då Standard-rotationen var en helt annan kanske det hade gett annorlunda resultat.
Supertypen Legendary var också en variabel som vi på förhand trodde skulle ingå i modellen. Legendary kort har ofta någon form av signifikans till berättelsen i MTG, till skillnad från övriga kort som t.ex. kan föreställa en generisk soldat. Det innebär att Legendary kort ofta är starkare eller har fler effekter än ett vanligt generiskt kort. I formatet Commander är dessutom generalen i majoriteten av fallen en Legendary Creature.
6.1 Möjliga felkällor
En möjlig felkälla som vi tror påverkade resultatet var om ett kort fanns i både folierat och ofolierat så valde vi priset för ofolierat. Felet uppstod på grund av hur datamaterialet var utformat, eftersom kort som fanns i både folierat och ofolierat räknades som samma kort. Ett sätt att komma runt det problemet hade kunnat vara att ta ett genomsnitt av priserna för de kort det gällde. Det hade också gått att göra en kopia av varje observation som det gällde och således få med både priset för folierat och för ofolierat. Resultatet hade troligtvis blivit att folierade kort hade haft högre positiv inverkan på priset, eftersom dummyvariabeln för foilerade kort antog värde 1 för de berörda korten även fast det var priset för ofolierat som användes. Tyvärr upptäcktes problemet alldeles för sent och hann aldrig åtgärdas.
En variabel som vi ställer oss frågande till om den verkligen är rätt i modellen är Conspiracy med koefficienten 45,83. Endast 25 kort hade huvudtypen Conspiracy och det dyraste av dessa kort kostade 0,30 USD. Vi anser att det hade varit rimligare om det gav en negativ inverkan på priset men enligt vår färdiga modell hade variabeln
Conspiracy en relativt stark positiv inverkan på priset.
Under bearbetningen togs de flesta supertyper och undertyper bort p.g.a. att det hade blivit flera hundratals variabler och hade gjort att det hade tagit längre tid att bearbeta. Vi valde ut de supertyper och undertyper som vi anade kunde ha en så pass stor inverkan på priset
21 att de inte kunde uteslutas. I den processen att välja ut kan vi ha missat andra typer som skulle kunnat haft stor inverkan på priset. Helst skulle alla typer vara med för att inte riskera att missa någon. 6.2 Möjliga förbättringar
Grundtanken var att få fram en modell med hjälp av LASSO och två modeller till att jämföra med. De två modellerna skulle tas fram med hjälp av backward- och forward stepwise regression. Detta var tyvärr inte genomförbart då tiden inte räckte till. Om undersökningen hade gjorts om hade mer fokus lagts på dessa processer då det hade varit intressant att jämföra olika modeller.
En variabel som vi hade velat ha med för att se om den hade varit statistiskt signifikant är hur många topplaceringar varje kort har haft i de professionella turneringarna som spelats. Problemet var att vi inte kunde finna något färdigt datamaterial med den informationen utan vi hade fått kolla upp antal topplaceringar manuellt för vardera av 45843 kort. Misstanken om att denna variabel hade varit intressant att undersöka grundar sig i det teoretiska scenariot att spelare som ser professionella spelare ha framgång med en specifik lek skulle kopiera den leken. Detta skulle då teoretiskt höja efterfrågan på korten i den leken och i kombination med oförändrat utbud höja priset på korten.
Slutligen är vi är nöjda över undersökningen överlag och även modellen vi har tagit fram. En del variabler som vi misstänkte skulle vara med på förhand fanns med i modellen även fast vissa hade mindre påverkan än vad vi trodde från början. Samtidigt trodde vi att vissa andra variabler också skulle påverka priset men de var inte alls med i modellen. Till slut kan vi fastställa att mer forskning på området behövs för att kunna ta fram ett säkrare resultat.
22
7 Referenslista
Ashley, M. (2011). World Records. Arcana, 14 september.
https://magic.wizards.com/en/articles/archive/arcana/world-records-2011-09-14
Cowling, P.I., Ward, C.D. & Powley, E.J. (2012). Ensemble Determinization in Monte Carlo Tree Search for the Imperfect Information Card Game Magic: The Gathering. IEEE Transactions
on Computational Intelligence and AI in Games, 4(4), pp.241–257.
doi: 10.1109/TCIAIG.2012.2204883.
Crutcher, P. (2017). Magic: The Gathering. Americana : The
Journal of American Popular Culture, 1900 to Present, 16(1).
James, G., Witten, D., Hastie, T. & Tibshirani, R. (2013). An
Introduction to Statistical Learning: with Applications in R. 8. uppl.,
New York: Springer US.
doi: 10.1007/978-1-4614-7138-7
Magic the Gathering. (u.å.1). Many ways to play.
https://magic.wizards.com/en/game-info/gameplay/rules-and-formats/formats [Hämtad 2020-06-11]
Magic the Gathering. (u.å.2). Rules.
https://magic.wizards.com/en/game-info/gameplay/rules-and-formats/rules [Hämtad 2020-06-10]
Magic the Gathering. (2016). Official Reprint Policy. News, 4 maj.
https://magic.wizards.com/en/articles/archive/official-reprint-policy-2010-03-10
Martin, B.A.S. (2004). Using the Imagination: Consumer Evoking and Thematizing of the Fantastic Imaginary. Journal of Consumer
Research, 31(1), pp.136–149. doi: 10.1086/383430.
Martin, B.A.S. (2019). The lure of the sorcerer: Consumers' consumption meanings in the context of trading card games.
Journal of Strategic Marketing, 27(2), pp.151–163. doi:
23 Reiley, D.H. (2006). Field experiments on the effects of reserve prices in auctions: more Magic on the Internet. RAND Journal of
Economics, 37(1), pp.195–211. doi:
10.1111/j.1756-2171.2006.tb00012.x.
Rosewater, M. (2006). As good as it gets. Making Magic, 5 juni.
https://magic.wizards.com/en/articles/archive/making-magic/good-it-gets-2006-06-05
Rosewater, M. (2013). 6/28/13 Episode 40: Wizards of the Coast.
Drive to Work Transcripts [blogg], 30 juni.
http://dtwtranscripts.blogspot.com/2013/06/62813-episode-40-wizards-of-coast.html [Hämtad 2020-05-05]
XE. (2020). XE Currency Table: EUR - Euro, 4 april.
https://www.xe.com/currencytables/?from=EUR&date=2020-04-04
24