DEGREE PROJECT, IN APPLIED MATHEMATICS AND INDUSTRIAL , FIRST LEVEL
ECONOMICS
STOCKHOLM, SWEDEN 2015
Analys av reporäntans påverkan på
prissättningen av bostäder
SLÅR REPORÄNTEFÖRÄNDRINGAR LIKA
MYCKET PÅ BOSTÄDER AV OLIKA STORLEK?
AMIT ALAM, INAS YAKUB
KTH ROYAL INSTITUTE OF TECHNOLOGY
Analys av reporäntans påverkan på
prissättningen av bostäder
Slår reporänteförändringar lika mycket på bostäder av olika storlek?I N A S Y A K U B A M I T A L A M
Examensarbete inom teknik: Tillämpad matematik och industriell ekonomi (15 credits) Civilingenjörsutbildning i industriell ekonomi (300 credits)
Kungliga Tekniska Högskolan 2015 Handledare på KTH Boualem Djehiche och Anna Jerbrant
Examinator Boualem Djehiche
TRITA-MAT-K 2015:01 ISRN-KTH/MAT/K--15/01--SE
Royal Institute of Technology School of Engineering Sciences KTH SCI
SE-100 44 Stockholm, Sweden
Abstract
The aim of this study is to investigate whether changes of the repo rate has diverse effects on apartments of different sizes, targeting specific areas in Stockholm. A conclusion, that the effect of the repo rate differs for apartments of different sizes, was made based on regression analysis and hypothesis testing. The housing market is characterized by vast shifts and the repo rate has reached a historical low-point of -0.25 per cent. It is reflected upon how the central bank’s steering interest rate actually impacts the prices on the housing market and whether it has distinct effects on apartments of different sizes. Apartments sold between years 2005-2015 have been analyzed where the gravity of the repo rate has been taken into consideration and if its significance varies amongst apartments of different sizes. Important parameters concerning apartment prices have been utilized in the constructed model.
Sammanfattning
Syftet med denna studie är att undersöka huruvida reporänteförändringar har diverse påverkan på bostäder av olika storlek, med fokus på ett antal områden i Stockholm. Efter utförda regressionsanalyser samt hypotesprövningar har det kunnat konstateras att reporäntans påverkan på bostadspriser skiljer sig åt för olika bostadsstorlekar.
Bostadsmarknaden präglas idag av stora förändringar och reporäntan är på en historisk lågpunkt, -0.25%. Det spekuleras kring hur Riksbankens styrränta faktiskt påverkar priserna på bostadsmarknaden och om denna påverkar olika stora bostäder i olika stor grad. Sålda lägenheter mellan åren 2005-2015 har analyserats där hänsyn har tagits till reporäntan. Analysens fokus har varit på reporäntans betydelse samt om denna
betydelse varierar för olika stora bostäder. Viktiga parametrar kring pris av bostadsrätter har använts i modellen som konstruerats.
Innehållsförteckning
1. Inledning ... 6
1.1. Problemformulering och frågeställning ... 6
1.2. Syfte ... 6 1.3. Avgränsningar ... 6 2. Teori ... 7 2.1. Linjär regression ... 7 2.2. Föklaringsgrad R2 ... 8 2.3. Heteroskedasticitet ... 8
2.4. F-‐test och p-‐värde ... 9
2.5. Multikollinaritet ... 10
2.6. Dummy variabler ... 10
2.7. Akaike Information Criterion ... 11
2.8. Hypotesprövning ... 11
3. Metod ... 11
3.1. Val av metod ... 11
3.2. Modell ... 12
3.3. Datainsamling ... 12
3.3.1. Valueguard ... 12
3.3.2. Val av variabler ... 12
3.3.3. Bortfall av data ... 13
4. Genomförande ... 14
5. Resultat ... 17
5.1. Enrumslägenheter ... 18
5.3. Trerumslägenheter ... 20
5.4. Fyrarumslägenheter ... 21
5.5. Sammanfattning av resultat ur data för reporänta ... 22
5.6. AIC ... 22
5.7. Ytterligare kring AIC och R2 ... 23
5.7.1. Sammanfattning för AIC och R2 för modell med/utan ”reporanta” .. 24
5.8. Heteroskadisticitet ... 25
5.8.1. Breusch-‐Pagan test, Normal Q-‐Q samt linjäranpassning ... 25
5.9. Multikollinaritet ... 27
5.9.1. Varians Inflations Faktorn, VIF ... 27
5.10. Hypotesprövning ... 28
6. Diskussion ... 30
6.1. Analys av resultat ... 30
6.2. Tillämpning ... 31
7. ”Hur reporäntan påverkar bostadspriserna ur ett nationalekonomiskt perspektiv” ... 32
7.1. Introduktion ... 32
7.2. Problemformulering och syfte ... 32
7.3. Metod ... 33
7.4.1. Reporänta ... 34 7.4.2. Inflation ... 36 7.4.3. Bolåneränta ... 37 7.4.4. Arbetslöshet ... 37 7.4.5. Dagslåneränta ... 38 7.5. Resultat INDEK ... 39 7.6. Diskussion ... 41 8. Slutsats ... 43 9. Referenser ... 44 10. Appendix ... 47
1. Inledning
Reporäntan har under det senaste halvåret genomgått historiska förändringar i Sverige.1 Riksbanken har sänkt reporäntan två gånger på väldigt kort tid och idag ligger denna på -0,25%2. En förändring av sådant slag påverkar mycket, inte minst kan reporäntan kopplas till priserna på bostadsmarknaden.
Många studier har gjorts kring bostadsmarknaden, där bland prediktion av
bostadspriser samt vilken tid på året som är bäst för ett bostadsköp. Dock har inga fördjupningar kring reporäntans påverkan på bostadsmarknaden tidigare gjorts eller kring huruvida olika stora bostäder påverkas till olika stor grad av
reporänteförändringar vilket i sig är ett aktuellt område att studera.
1.1. Problemformulering och frågeställning
Den frågeställning som undersöks i detta kandidatexamensarbete lyder:
i. “Slår reporänteförändringar olika mycket på bostadsrätter av olika storlek?”. Det som är av intresse är hur förändring av reporäntan slår på små bostäder jämfört med stora bostäder.
Utöver den matematiska frågeställningen ovan undersöks reporäntans påverkan på bostadsmarknaden ur nationalekonomiskt perspektiv med frågeställning:
ii. “Hur påverkar reporäntan bostadsmarknaden ur nationalekonomiskt perspektiv?”
1.2. Syfte
Syftet med kandidatexamensarbetet är att genom statistiska metoder analysera och bidra med relevanta resultat till företaget Valueguard. I dessa resultat ska det tydliggöras om reporäntans påverkan på bostadspriset skiljer sig åt beroende på bostadens storlek. Undersökningen om hur reporäntan påverkar bostadsmarknaden ur nationalekonomiskt perspektiv kommer att bidra till en djupare förståelse. Detta då bostadsmarknaden förklaras utöver de matematiska analyser som görs samt kopplas ihop med dessa.
1.3. Avgränsningar
En avgränsning som görs är att endast fokusera på lägenheter i ett antal områden i Stockholm. Områdena som väljs kommer att vara av olika typer - ett par områden som ligger i utkanten av Stockholm - Sollentuna, Solna, Sundbyberg har valts för att fokusera på, samt några i centrala Stockholm. Detta urval har gjorts utav
1 Ekonomifakta (2015), Reporäntans utveckling [www]. Hämtat från
<http://www.ekonomifakta.se/sv/Fakta/Ekonomi/Finansiell-utveckling/Styrrantan/>. Publicerat 18 mars 2015. Hämtat 24 mars 2015.
2 Reporänta (2015), Reporäntebeslut[www]. Hämtat från
< http://www.riksbank.se/sv/Penningpolitik/Prognoser-och-rantebeslut/Reporantebeslut/2015/Reporantebeslut-28-april-2015/>. Publicerat 28 april 2015. Hämtat 28 april 2015.
vicedirektören för Valueguard, Lars-Erik Eriksson, och baseras på områden som är av intresse för företaget. Olika områden väljs för att priset för lägenheter tenderar att vara lägre i de förstnämnda områdena samt högre i centrala Stockholm och en övergripande analys eftersträvas. De lägenheter som sålts i dessa områden delas in i olika kategorier efter antal rum där de lägenheter som avviker starkt ur det normala för det antal rum, vad gäller kvadratur bland annat, väljs bort.
2. Teori
2.1. Linjär regression
Inom statistisk analys är det vanligt förekommande att en responsvariabel kan förklaras genom förklarande variabler, så kallade kovariat. Dessa kovariat kan vara kvalitativa eller kvantitativa, experimentella eller observationsbaserade.3 Linjär regression är en statistik modell genom vilken man studerar samband mellan variabler. I modellen ingår en responsvariabel y, vars värde beror på en eller flera förklarande variabler, kovariat, x . Den generella modellen för linjär regression skrivs enligt:4
yi= xijβj+εi, i = 1,..., n j=0
k
∑
I följande modell är en observation av den beroende variabeln y vars värde beror på de förklarande variablerna samt residualen. Residualerna antas vara oberoende mellan observationerna så att:
E(εi) = 0 samt E(εi
2
) =σ2 där σ är okänd. Vanligtvis är kovariaten konstant 1 och β0 är intercept. Efter introduktion av xi =(xi0...xik),i=1,...,n samt β= (β0...βk)
t
kan modellen för regressionsanalys nu skrivas som:
yi= xiβ +εi
5
Regressionskoefficienten βj, som anger den genomsnittliga förändringen för y när xn ändras med en enhet, är obekant och kommer att beräknas från det data som
finns. β0 är det uppskattade värdet av y (när x = 0). Feltermer betecknas med εi.
För att anpassa en linjär modell som förklarar sambandet mellan residualen yi och
kovariaten xi behöver vi uppskatta värdena för β, som betecknasβ , genom att ˆ
minimera kvadratsumman av residualen ε∧2
i=1 n
∑
. Detta kan göras med:Y = X β∧+ε∧
3 Lang, Harald. Elements of Regression Analysis
4 Miller, Michael B. Mathematics and Statistics for Financial Risk Management, Wiley, 2012, 2nd Edition 5 Lang, Harald. Lang, Harald. Elements of Regression Analysis
2.2. Föklaringsgrad R
2R2, som ofta kallas för förklaringsgrad eller determinationskoefficient, är ett
statistiskt mått på hur nära datat är regressionslinjen. R2-koefficienten anger hur stor del av variationerna av y som kan förklaras av variationer av de oberoende
variablerna x . Koefficienten antar värden 0 till 1 (eller 0% till 100%) där ett värde på 1 indikerar att regressionslinjen passar datat perfekt. Målet är att residualerna minimeras - att uppnå ett högt värde för R2. Förklaringsgraden R2 är lika med den del av den totala kvadratsumman som utgörs av den residuala kvadratsumman:.
𝑅! =𝑘𝑣𝑎𝑑𝑟𝑎𝑡𝑠𝑢𝑚𝑚𝑎𝑛 𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙
𝑘𝑣𝑎𝑑𝑟𝑎𝑡𝑠𝑢𝑚𝑚𝑎𝑛 𝑡𝑜𝑡𝑎𝑙 =
(𝑦! − 𝑦)!
(𝑦! − 𝑦)!
Där 𝑦! är det förväntade värdet av yi och 𝑦 är medelvärdet av yi.
R2 värdet ökar med varje oberoende variabler x som läggs till i modellen.
Konsekvenserna av detta blir en chans till ett falskt R2 -värde samt högre osäkerhet. Användningen av ett korrigerat 𝑅2 tar hänsyn till detta genom att istället minska i värde då extra x-variabler läggs till.
𝑅! = 1 − 𝑒
!! 𝑛 − 𝐾 / 𝑦!! 𝑛 − 1
där n är totala datamängd, K är antal oberoende variabler.
𝑅2 är alltid ≤ R2 och kan anta negativa värden. Summan av residualerna är icke-växande för varje variabel som läggs till men antalet frihetsgrader ökar med en. Den tillagda variabeln kan medföra till ett sänkt 𝑒!! 𝑛 − 𝐾 vilket innebär en ökning
av 𝑅2. 𝑅2 når ett maximalt värde då ett visst antal variabler läggs till. Vid denna punkt har regressionen en ideal kombination av “goodness of fit” och “exkludering av onödiga termer”. Det går att dra samband mellan 𝑅2 och R2 på följande vis6:
1 − 𝑅2 = (1 − 𝑅!) 𝑛 − 1 𝑛 − 𝐾
2.3. Heteroskedasticitet
Det vanliga antagandet är att alla residualer 𝜀! har samma standardavvikelse σ . Detta antagande är ofta obefogat - det existerar då heteroskedastiska residualer.
yi= j=0xijβj+ ei, i =1,..., n k
∑
där E(ei) = 0 och E(ei2 ) =σi
2
Om modellen är felaktigt specificerad som en homoskedastisk ekvation orsakar denna felaktiga specificering att standardavvikelsen för parameterestimeringarna är
inkonsistenta. Utöver detta blir F-testets resultat då ogiltigt. Vid heteroskedasticitet är det viktigt att omformulera modellen med avsikten att heteroskedasticitet inte ska förekomma.
När feltermerna 𝜀! har en konstant standardavvikelse råder homoskedasticitet,
variansen kan förklaras 𝑉𝑎𝑟 𝑒! 𝑥! = 𝜎!. Det råder istället heteroskedasticitet vid
fall då feltermerna inte är konstanta och variansen istället beror på xi: 𝑉𝑎𝑟 𝑒! 𝑥! =
𝑓(𝑥!). Enklaste sättet att undersöka och upptäcka heteroskedasisticitet är att rita residualernas fördelning för varje variabel och se ifall feltermerna är konstanta eller ändras för varje xi.
7
Även genom utförandet av Breusch-Pagan test kan man undersöka existensen av heteroskedasticitet. Det som studeras då är utifall att den estimerade variansen av residualerna är beroende av kovariaten. Vid utförandet av en Ordinary Least Squares regression erhålls εi, residualer. En hjälpregression utförs förεi
2:
εi
2
=α0+α1Xi1+... +αpXip+ ui där i =1,..., p och ui är regressionens residual.
Vidare ställs hypoteser upp:
H0:γ1=γ2 =γn= 0
H1=γn≠ 0 för alla i = 1,..., n
Dessa hypoteser prövas genom att en förklaringsgrad för given residual Rεˆ i2
2
beräknas vilken hypotesprövningarna sedan grundas på. Hypotesen om homoskedasticitet förkastas endast om H0förkastas på vald signifikansnivå.
8
2.4. F-test och p-värde
Estimationen av standard avvikelsen, det så kallade standardfelet, av β∧jär SE(β
∧
j) .
Ett konfidensintervall för nivån α för βj är:
β
∧
j± Fα(1, n − k −1)SE(β ∧
j) där Fα(1, n − k −1) är α-kvantilen för F-fördelningen för
täljare med en frihetsgrad samt nämnare med n − k −1frihetsgrader. F-statistiken
blir då: F = β ∧ j−βj 0 SE(β∧j) # $ % % & ' ( ( 2
p-värdet är Pr(X>F) där X har F-fördelning som ovan.
e∧ betecknar residualer från en obegränsad regression samt e∧*residualerna från en
begränsad regression, vid en hypotesprövning för ett flertal β. Om residualen e är
7 Lang, Harald. Elements of Regression Analysis
normalfördelad är det exakta F-testet: F =1 r e∧* 2 − e∧ 2 s2 = n − k −1 r e ∧ * 2 e∧ 2 −1 # $ % % % % & ' ( ( ( (
F är F(r, n − k −1) fördelad under noll och hypotesen förkastas då F är stort.9
2.5. Multikollinaritet
Multikollinaritet existerar när två eller flera kovariat är linjärt beroende. Multikollinaritet kan upptäckas genom att observera att de uppskattade standardavvikelserna för vissa av regressionkoefficienterna är väldigt stora. En annan indikator för multikollinaritet är Varians Inflations Faktorn, VIF. En hjälpregression där en av kovariaten används som beroende variabel vid skattning av resterande kovariat görs. Utgångsmodellen är
Y = β0+β1X1+β2X2+... +βKXK+ε via vilken en hjälpregression kan utföras för
varje kovariat där ett R2 erhålls genom vilket VIF kan beräknas enligt:
VIFi= 1
1− R2
Ett värde över 10 för VIF indikerar att multikollinaritet existerar för det givna kovariatet. 10
2.6. Dummy variabler
I många modeller kan det ingå kvalitativa och förklarande kovariat och då är det passande med dummy variabler. I fall där en variabel är en dummy variabel kan denna anta värdet 0 eller 1. Dummy variabler som alla beskriver en och samma egenskap ska ha ett värde på 1; om säsongen för försäljning av en bostad ska ingå i modellen kommer den säsong då bostaden är såld att ha värdet 1 vid sig och resterande säsonger värdet 0. Vid liknande kategorier brukar man använda sig av
n −1antal dummy variabler; det finns fyra säsonger under ett år och i modellen kommer det därför att användas tre kategorier för dessa och den fjärde säsongen kommer att istället väljas som en referenspunkt (benchmark).11
9 Lang, Harald. Elements of Regression Analysis
10 Westerlund, Joakim. Introduktion till ekonometr”, Studentliteratur, 2005, Upplaga 1 11 Baltagi,Badi H. Econometrics, Springer, 2008, 4th Edition.
2.7. Akaike Information Criterion
Vid osäkerhet kring huruvida en kovariat bör vara med i en modell kan man utföra ett så kallat Akaike Information Criterion, AIC test. Introduktionen av AIC år 1973 av Aikaike har främjat erkännandet av vikten av god modellering inom statistik. Utifrån denna modell har flera andra viktiga statistiska modeller inom bland annat ekonometri utvecklats.12
Den modell som minimerar 𝑛 𝜀 ! + 2𝑘 väljs, där n är antal observationer och k är
antal kovariat. Vid logit minimeras −2 ln(L)+ 2k där ln(L) är log-likelihood funktionen:13 ln(L) = ln 2d
(
i−1)
p x# iβ∧ $ % & ' ( +1− di ) * + , -. i=1 n∑
Ett lägre värde vid utfört AIC-test indikerar en bättre modell.
2.8. Hypotesprövning
Vid hypotesprövning testar man om en okänd parameter θ är lika stor som θ0. Vid
hypotesprövningen studeras alla hypoteser θ= aför alla möjliga a . Med en accepterad felfrekvens α gäller då att varje hypotes θ= a som genererar ett p-värde som störst α måste vara falsk och kan då förkastas.
Om en hypotesprövning görs för ett flertal β -värden görs detta med F -test. F har en F(r, n − k −1) fördelning och hypotesen förkastas om F -värdet är stort.14
3. Metod
3.1. Val av metod
Metoderna som används är huvudsakligen regressionsanalys samt andra statistiska analyser där bland undersökning av p-värden, som beräknas från F-tester för undersökning av variablernas signifikans, samt Breusch-Pagan test för heteroskedasticitet. Därav har arbetet en kvantitativ ansats.
12 H. Bozdogan, Model Selection and Akaike’s Information Criterion (AIC): The General Theory and Its
Analytical Extensions, Psychometrika, 52 (1987), 345–370.
13 Lang, Harald. Elements of Regression Analysis 14 Ibid
3.2. Modell
En grundmodell för priset per kvadratmeter med förklarande variabler har konstruerats, där separata modeller sätts upp och analyseras för kategorier med olika antal rum.
n i x x x x x x x x x x x x x x x x x x x x x x i Toppvåning ng Mellanvåni ng Bottenvåni Vår Höst Sommar Byggnadsår Byggnadsår Byggnadsår Byggnadsår Byggnadsår Byggnadsår Byggnadsår Byggnadsår Byggnadsår Byggnadsår Ort Hiss Boyta kvm ft Månadsavgi Reporänta ,..., 1 ter kvardratme per Pris 22 21 20 Vinter 19 18 17 16 ) 2015 2010 ( 15 ) 2009 2000 ( 14 ) 1999 1990 ( 13 ) 1989 1980 ( 12 ) 1979 1970 ( 11 ) 1969 1960 ( 10 ) 1959 1950 ( 9 ) 1949 1940 ( 8 ) 1939 1900 ( 7 ) 1899 1800 ( 6 5 4 3 / 2 1 0 = + + + + + + + + + + + + + + + + + + + + + + + + = − − − − − − − − − − ε β β β β β β β β β β β β β β β β β β β β β β β
Utöver denna grundmodell för respektive lägenhetskategori används en sammanslagen modell för bland annat hypotesprövning där samtliga lägenhetskategorier ingår. Denna sammanslagna modell är likadan som grundmodellen men data för samtliga lägenhetskategorier slås ihop.
3.3. Datainsamling
3.3.1. Valueguard
Statistik kring bostadspriser och relaterade faktorer erhålls via företaget Valueguard. Det är viktigt att kunna ha en stor överblick över försäljningen av lägenheter för att kunna dra slutsatser kring reporäntan och dess påverkan. Datat omfattar lägenheter sålda i Stockholms innerstad samt ett antal områden utanför Stockholms innerstad mellan åren 2005-2015.
3.3.2. Val av variabler
Pris/kvadratmeter [SEK]: Försäljningspriset per kvadratmeter av bostaden. Detta
blir modellens responsvariabel(output). Nedan följer modellens kovariat:
Reporänta [procent]: Anger reporäntan vid försäljningdatum. Hämtas från
Bostadsavgift/kvm [SEK/månad] : Avgift som betalas in till bostadsföreningen
som täcker de gemensamma kostnaderna. Denna kovariat kommer att anges i SEK/kvm för att undvika eventuell korrelation mellan kovariatet gentemot arean.
Boyta [m2]: Anger lägenhetens totala area i kvadratmeter.
Våning [Dummyvariabel; Ja(1)/Nej(0)]: Denna variabel delas in i tre kategorier: botten, mellan, topp. Anger om lägenheten befinner sig på bottenvåning,
toppvåning eller våning emellan.
Hiss [Dummyvariabel; Ja(1)/Nej(0)] : Anger om byggnaden har tillgång till hiss. Ort[Dummyvariabel; Innerstan(1)/Förort(0)]: Anger om bostadsrätten befinner
sig i Stockholms innerstan (Ort=1) eller i en Stockholms förort (Ort=0).
Byggnadsår [Dummyvariabel; Ja(1)/Nej(0)]: Variabeln är indelad i sex
tidsintervaller och anger ifall bostadsrätten byggdes mellan 1800-1899, 1900-1939, 1940-1949, 1950-1959, 1960-1969, 1970-1979, 1980-1989, 1990-1999, 2000-2009 eller 2010-2015.
Säsong [Dummyvariabel; Ja(1)/Nej(0)]: Variabeln delas in fyra kategorier: vår,
sommar, höst, vinter. Anger om lägenheten blev såld under vår-, sommar-, höst-, vinterperiod.
3.3.3. Bortfall av data
Endast utvalda variabler inkluderas i modellen på grund av relevans samt brist på datamängd för vissa variabler.
3.3.3.1. Extremvärden
Lägenheterna delas in de i olika kategorier baserat på det antal rum som
bostadsrätten har. Fokus blir då endast på enrumslägenheter, tvårumslägenheter, trerumslägenheter samt fyrarumslägenheter och därmed exkluderas lägenheter med fem eller fler rum. Utöver denna indelning har lägenheter mellan 10:e samt 90:e percentilen tagits med för att allt för avvikande kvadratur inte ska ingå.
Extremvärden kring byggnadsår har uteslutits - alla lägenheter som byggts innan år 1800 har uteslutits. Även alla bostadsrätter med en bostadsavgift under 1000 kr har exkluderats ur datamängden. Dessutom har lägenheter som saknar information kring huruvida det finns hiss eller ej i huset valts bort ur datamängden. Dessa val har gjorts då avvikelser likt ovannämnda fall kan innebära felaktig information som kan leda till vilseledande resultat i analysen.
3.3.3.2. Variabler
En påverkande faktor till slutpriset av en bostadsrätt är bland annat närheten till kollektivtrafik. En bostad som har nära till en busstation eller liknande har ett högre värde. Att ta fram data för detta visade sig vara ogenomförbart och därför utesluts denna variabel ur modellen.
Om en bostad har en balkong eller inte påverkar pris samt efterfrågan på bostaden. I den datasamling som tillhandahölls av Valueguard var datat för denna variabel inte komplett för alla objekt, det saknades information kring huruvida en stor del av bostäderna hade en balkong eller ej, och därför uteslöts denna variabel. Det är inte konsekvent att anta huruvida en lägenhet har en balkong eller ej då datat är
bristfälligt.
Variabeln Våning är som tidigare nämnt indelad i tre kategorier. En bostad som ej faller in i någon av dessa kategorier anses befinna sig på etageplan. Dessa bostäder har exkluderats då chansen finns att dessa inte är lägenheter utan någon annan typ av bostadsform.
Vad gäller kategorierna Säsong, Våning samt Byggnadsår har alternativen ”Vinter” för Säsong, ”Mellanvåning” för Våning samt ”Byggnadsår 1900-1939” för
Byggnadsår valts ut till att vara variabler av referenstyp, så kallade benchmarks.15
4. Genomförande
Data för 185 075 bostäder sålda mellan åren 2005 till början på år 2015 har erhållits via Valueguard. Efter bortfall av extremvärden har ett slutgiltigt antal av 151 354 bostäder satt grunden för den analys som genomförts.
Till en början fanns det 48 olika förklarande variabler kring dessa bostäder. Efter en genomgång av dessa variabler valdes ungefär hälften bort. Variabler så som vilket år och vilken månad lägenheten har sålts samt en kombination av dessa två har tagits bort och datum för lägenhetsförsäljningen har behållts. Koordinater för de sålda bostadsrätterna kommer inte att vara av nytta då det saknas koordinater för närmsta station för kollektivtrafik.
Kategorisering av de olika lägenheterna görs efter antal rum. Denna kategorisering görs då regressionsanalyser ska utföras dels för varje enskild lägenhetskategori samt för hela datamängden. Efter indelning i kategorier begränsas varje kategori inom ett rimligt intervall. Detta för att lägenheter med för avvikande yta inte ska bidra till missvisning. Dessa intervaller utgörs av data mellan den 10:e och 90:e percentilerna ur datasamlingen för area. Efter exkludering av lägenheter som inte ligger inom intervallerna ser indelningen för varje kategori ut som nedan:
Enrumslägenheter 25-44 kvadratmeter Tvårumslägenheter 41-68 kvadratmeter Trerumslägenheter 66-90 kvadratmeter Fyrarumslägenheter 84-118 kvadratmeter
Efter denna indelning i intervall kvarstårföljande mängd data kring sålda bostäder: Totalt antal Antal efter urval
Enrumslägenheter 31 440 25 962
Tvårumslägenheter 63 926 52 085
Trerumslägenheter 37 487 30 357
Fyrarumslägenheter 14 708 11 975
Totalt 120 379
Kategorisering rörande byggnadsår görs dessutom. Bostadsrätter som byggts innan år 1800 exkluderas ur datamängden och sedan delas byggnadsåren in i följande kategorier: År 1800-1899 1900-1939 1940-1949 1950-1959 1960-1969 1970-1979 1980-1989 1990-1999 2000-2009 2010-2015
Sex stycken hypotesprövningar har gjorts där det undersökts huruvida nollhypotesen för att β -värdena för kovariatet reporänta för två olika
lägenhetskategorier är likadana, kan förkastas eller ej. Följande hypoteser ställs upp och testas på signifikansnivån 5%:
1. H
0:β
reporänta _ enrumslägenheter=
β
reporänta _ tvårumslägenheterH
1:β
reporänta _ enrumslägenheter≠
β
reporänta _ tvårumslägenheter
2. H
0:
β
reporänta _ enrumslägenheter=
β
reporänta _ trerumslägenheterH
1:
β
reporänta _ enrumslägenheter≠
β
reporänta _ trerumslägenheter3. H
0:
β
reporänta _ enrumslägenheter=
β
reporänta _ fyrarumslägenheterH
1:
β
reporänta _ enrumslägenheter≠
β
reporänta _ fyrarumslägenheter4. H
0:
β
reporänta _ tvårumslägenheter=
β
reporänta _ trerumslägenheterH
1:
β
reporänta _ tvårumslägenheter≠
β
reporänta _ trerumslägenheter5. H
0:β
reporänta _ tvårumslägenheter=
β
reporänta _ fyrarumslägenheterH
1:β
reporänta _ tvårumslägenheter≠
β
reporänta _ fyrarumslägenheter6. H
0:
β
reporänta _ trerumslägenheter=
β
reporänta _ fyrarumslägenheterH
1:
β
reporänta _ trerumslägenheter≠
β
reporänta _ fyrarumslägenheter5. Resultat
Nedan följer en sammanställning av betavärden för kovariatet reporänta för samtliga lägenhetskategorier. Resterande resultat av den sammanslagna regressionsanalysen återfinns i appendix.
Residuals:
Min 1Q Median 3Q Max
-‐3.04158 -‐0.18352 0.02173 0.20209 1.69827
Coefficients:
Estimate Std. Error t value Pr(>|t|) (Intercept) 11.6803401 0.0109521 1066.494 < 2e-‐16 *** Enrumreporanta -‐8.6144032 0.1653585 -‐52.095 < 2e-‐16 *** Tvårumreporanta -‐7.7027363 0.1154365 -‐66.727 < 2e-‐16 *** Trerumreporanta -‐7.9970659 0.1550494 -‐51.578 < 2e-‐16 *** Fyrarumreporanta -‐7.2649167 0.2475078 -‐29.352 < 2e-‐16 *** -‐-‐-‐ Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.3131 on 120301 degrees of freedom Multiple R-‐squared: 0.5273, Adjusted R-‐squared: 0.527
F-‐statistic: 1766 on 76 and 120301 DF, p-‐value: < 2.2e-‐16 Denna sammanslagna grundmodell genererar ett R2
värde på 0.5273 samt ett R2
på 0.527, vilket tyder på att regressionslinjen inte passar datat perfekt samt att
5.1. Enrumslägenheter
Kovariatet reporänta har ett β -värde på -8.6144032 för enrumslägenheter med boyta på 25-44 kvm vilket visar att då reporäntan ökar sänks försäljningspriset/kvm för enrumslägenheter. Detta β -värde används för att bland annat svara på
frågeställningen om hur reporäntan påverkar priset av olika stora lägenheter. Nedan presenteras resultat ur ANOVA-analys för enrumslägenheter. Detta görs för att få fram F -värden för varje kovariat som indikerar signifikansnivån för
respektive.
Analysis of Variance Table
Response: log(Pris_per_kvm)
Df Sum Sq Mean Sq F value Pr(>F) reporanta 1 240.98 240.98 3496.4315 < 2.2e-‐16 *** monthly_kvm 1 74.24 74.24 1077.2204 < 2.2e-‐16 *** h_area 1 351.38 351.38 5098.3226 < 2.2e-‐16 *** b_elevator 1 106.78 106.78 1549.3323 < 2.2e-‐16 *** Ort2 1 131.71 131.71 1911.0344 < 2.2e-‐16 *** b_year1800_1899 1 43.72 43.72 634.4090 < 2.2e-‐16 *** b_year1940_1949 1 0.07 0.07 1.0262 0.3111 b_year1950_1959 1 198.76 198.76 2883.8984 < 2.2e-‐16 *** b_year1960_1969 1 104.71 104.71 1519.2093 < 2.2e-‐16 *** b_year1970_1979 1 136.81 136.81 1984.9761 < 2.2e-‐16 *** b_year1980_1989 1 4.82 4.82 69.9629 < 2.2e-‐16 *** b_year1990_1999 1 23.25 23.25 337.3867 < 2.2e-‐16 *** b_year2000_2009 1 67.97 67.97 986.2111 < 2.2e-‐16 *** b_year2010_2015 1 35.80 35.80 519.4216 < 2.2e-‐16 *** Spring 1 4.02 4.02 58.3032 2.324e-‐14 *** Summer 1 0.08 0.08 1.1771 0.2780 Autumn 1 0.17 0.17 2.4105 0.1205 Botten 1 1.36 1.36 19.7369 8.924e-‐06 *** Topp 1 0.02 0.02 0.3324 0.5642 Residuals 25941 1787.89 0.07 -‐-‐-‐ Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Variabeln reporänta har ett högt F -värde, närmre bestämt 3496.4315, vilket resulterar i ett lågt p-värde. Reporänta har med andra ord en hög signifikans för modellen för enrumslägenheter. De variabler som erhåller ett lågt F -värde/högt p-värde i denna modell för enrumslägenheter är: b_year1960_1969,
b_year1980_1989, Summer, Autumn, Mellan.
5.2. Tvårumslägenheter
Kovariatet reporänta har ett β -värde på -7.7027363 för tvårumslägenheter med boyta på 41-68 kvm vilket visar återigen att då reporäntan höjs sänks
försäljningspriset/kvm. Detta β -värde är mindre negativ än för enrumslägenheter. Nedan presenteras resultat ur ANOVA-analysen för tvårumslägenheter. Detta görs för att få fram F -värden för varje kovariat som indikerar signifikansnivån för respektive.
Analysis of Variance Table
Response: log(Pris_per_kvm)
Df Sum Sq Mean Sq F value Pr(>F)
reporanta 1 371.1 371.10 4231.3235 < 2.2e-‐16 *** monthly_kvm 1 901.1 901.14 10274.9592 < 2.2e-‐16 *** h_area 1 542.1 542.07 6180.7548 < 2.2e-‐16 *** b_elevator 1 377.1 377.13 4300.1695 < 2.2e-‐16 *** Ort2 1 265.4 265.39 3026.0261 < 2.2e-‐16 *** b_year1800_1899 1 279.0 279.04 3181.7295 < 2.2e-‐16 *** b_year1940_1949 1 5.4 5.38 61.2903 5.018e-‐15 *** b_year1950_1959 1 431.6 431.59 4921.0813 < 2.2e-‐16 *** b_year1960_1969 1 240.4 240.40 2741.0622 < 2.2e-‐16 *** b_year1970_1979 1 528.2 528.15 6022.1222 < 2.2e-‐16 *** b_year1980_1989 1 188.5 188.47 2148.9308 < 2.2e-‐16 *** b_year1990_1999 1 161.3 161.29 1839.0132 < 2.2e-‐16 *** b_year2000_2009 1 121.9 121.88 1389.7473 < 2.2e-‐16 *** b_year2010_2015 1 57.7 57.69 657.8465 < 2.2e-‐16 *** Spring 1 3.1 3.11 35.5000 2.567e-‐09 *** Summer 1 0.8 0.82 9.4009 0.00217 ** Autumn 1 0.0 0.00 0.0461 0.83005 Botten 1 0.5 0.47 5.3731 0.02045 * Topp 1 0.5 0.55 6.2199 0.01264 * Residuals 52065 4566.2 0.09 -‐-‐-‐ Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Kovariatet reporänta har ett högt F -värde, 4231.3235, vilket resulterar i ett lågt p-värde. Reporänta har här med andra ord en hög signifikans för modellen. De variabler som erhåller ett lågt F -värde/högt p-värde i denna modell för tvårumslägenheter är: Summer, Botten, Mellan.
5.3. Trerumslägenheter
Kovariatet reporänta har ett β -värde på -7.9970659 för trerumslägenheter med boyta 66-90 kvm vilket återigen visar att reporäntan har en negativ påverkan på priset. Detta β -värde är mindre negativ än för enrumslägenheter men mer negativ än för tvårumslägenheter.
Nedan presenteras resultat ur ANOVA-analysen för trerumslägenheter. Detta görs för att få fram F -värden för varje kovariat som indikerar signifikansnivån för respektive.
Analysis of Variance Table
Response: log(Pris_per_kvm)
Df Sum Sq Mean Sq F value Pr(>F) reporanta 1 281.0 280.98 2240.9919 <2e-‐16 *** monthly_kvm 1 582.4 582.37 4644.7445 <2e-‐16 *** h_area 1 20.3 20.34 162.1977 <2e-‐16 *** b_elevator 1 342.9 342.87 2734.6115 <2e-‐16 *** Ort2 1 206.8 206.82 1649.4967 <2e-‐16 *** b_year1800_1899 1 260.1 260.14 2074.8039 <2e-‐16 *** b_year1940_1949 1 88.3 88.31 704.3263 <2e-‐16 *** b_year1950_1959 1 81.0 81.00 646.0433 <2e-‐16 *** b_year1960_1969 1 374.6 374.64 2987.9743 <2e-‐16 *** b_year1970_1979 1 1075.6 1075.60 8578.5859 <2e-‐16 *** b_year1980_1989 1 194.6 194.60 1552.0633 <2e-‐16 *** b_year1990_1999 1 46.6 46.62 371.7968 <2e-‐16 *** b_year2000_2009 1 42.7 42.72 340.7546 <2e-‐16 *** b_year2010_2015 1 38.3 38.32 305.6294 <2e-‐16 *** Spring 1 0.1 0.11 0.8580 0.3543 Summer 1 0.2 0.22 1.7860 0.1814 Autumn 1 0.3 0.31 2.4454 0.1179 Botten 1 0.0 0.03 0.2149 0.6430 Topp 1 0.0 0.01 0.1124 0.7375 Residuals 30337 3803.7 0.13 -‐-‐-‐ Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Kovariatet reporänta har ett högt F -värde, 2240.9919,vilket resulterar i ett lågt p-värde. Reporänta har här med andra ord en hög signifikans för modellen. De variabler som erhåller ett lågt F -värde/högt p-värde i denna modell för
trerumslägenheter är: b_year2000_2009, Summer, Autumn, Spring, Botten, Mellan.
5.4. Fyrarumslägenheter
Kovariatet reporänta har ett β -värde på -7.2649167 för fyrarumslägenheter med
boyta på 84-118 kvm vilket visar återigen reporäntan har en negativ påverkan på
priset. Detta β -värde är mindre negativ än för enrums-, tvårums samt trerumslägenheter.
Nedan presenteras resultat ur utförd ANOVA-analys för fyrarumslägenheter. Detta görs för att få fram F -värden för varje kovariat som indikerar signifikansnivån för respektive.
Analysis of Variance Table
Response: log(Pris_per_kvm)
Df Sum Sq Mean Sq F value Pr(>F)
reporanta 1 81.78 81.78 599.3288 < 2.2e-‐16 *** monthly_kvm 1 508.18 508.18 3724.4072 < 2.2e-‐16 *** h_area 1 51.86 51.86 380.0452 < 2.2e-‐16 *** b_elevator 1 101.13 101.13 741.1624 < 2.2e-‐16 *** Ort2 1 62.05 62.05 454.7308 < 2.2e-‐16 *** b_year1800_1899 1 55.32 55.32 405.4376 < 2.2e-‐16 *** b_year1940_1949 1 19.81 19.81 145.1891 < 2.2e-‐16 *** b_year1950_1959 1 35.87 35.87 262.9105 < 2.2e-‐16 *** b_year1960_1969 1 119.24 119.24 873.9281 < 2.2e-‐16 *** b_year1970_1979 1 171.30 171.30 1255.4367 < 2.2e-‐16 *** b_year1980_1989 1 81.19 81.19 595.0542 < 2.2e-‐16 *** b_year1990_1999 1 40.38 40.38 295.9740 < 2.2e-‐16 *** b_year2000_2009 1 11.62 11.62 85.1739 < 2.2e-‐16 *** b_year2010_2015 1 6.28 6.28 45.9932 1.243e-‐11 *** Spring 1 0.01 0.01 0.0575 0.8106 Summer 1 0.15 0.15 1.1019 0.2939 Autumn 1 0.04 0.04 0.2763 0.5992 Botten 1 0.01 0.01 0.0373 0.8469 Topp 1 0.19 0.19 1.4256 0.2325 Residuals 11955 1631.22 0.14 -‐-‐-‐ Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Kovariatet reporänta har ett högt F -värde på 599.3288 vilket resulterar i ett lågt p-värde. Reporänta har här med andra ord en hög signifikans för modellen. De variabler som erhåller ett lågt F -värde/högt p-värde i denna modell för fyrarumslägenheter är: b_year2000_2009, Summer, Autumn, Spring, Botten,
5.5. Sammanfattning av resultat ur data för reporänta
Nedan presenteras en sammanställning av alla resultat kring kovariatet reporänta från regressionsanalyserna samt ANOVA analyser för de olika rumskategorierna.
Reporänta Enrumslägenheter Tvårumslägenheter Trerumslägenheter Fyrarumslägenheter
Estimate -8.6144032 -7.7027363 -7.9970659 -7.2649167
Std. Error 0.0109521 0.1154365 0.1550494 0.2475078
t value -52.096 -66.272 -51.578 -29.352
Pr(>|t|) <2e-16*** < 2e-16 *** <2e-16*** < 2e-16 ***
Df 1 1 1 1
Sum Sq 240.98 371.1 281.0 81.78
Mean Sq 240.98 371.10 280.98 81.78
F value 3496.4315 4231.3235 2240.9919 599.3288
Pr(>F) <2.2e-16*** < 2.2e-16 *** <2.2e-16*** < 2.2e-16 ***
Det framgår tydligt att reporäntan påverkar priset negativt för alla bostäder. Enligt
F -värdena har reporänta högst signifikans för tvårumsmodellen därefter för
enrums-, trerums- och sist fyrarumsmodellen.
5.6. AIC
Undersökning kring modell utan kovariat reporänta där reg är modell med reporänta som kovariat och reg3 modell utan reporänta.
Ettor df AIC reg3 21 4255.953 reg3 20 7832.118 Tvåor Df AIC reg 21 21067.85 reg3 20 25775.59
En modell med så lågt AIC som möjligt eftersträvas då detta indikerar en bättre modell. Ovan framgår det tydligt att en modell med kovariat reporänta har lägre AIC-värde för samtliga rumskategorier jämfört med en modell utan reporänta. Detta stärker att reporänta som kovariat med säkerhet bör inkluderas i samtliga modeller.
Treor df AIC reg 21 23138.51 reg3 20 25129.41 Fyror df AIC reg 21 10153.49 reg3 20 10732.81
5.7. Ytterligare kring AIC och R
2Ur regressionsanalyserna för de olika rumskategorierna erhölls R2 värden mellan
0.452 och 0.495 för de olika rumskategorierna, vilket inte anses vara högt. Ur ANOVA-analyserna kunde det observeras att olika kovariat erhöll låga F -värden för de olika rumskategorier. Dessa sammanställs nedan:
Ettor b_year1960_1969, b_year1980_1989, Summer , Autumn, Mellan Tvåor Summer, Botten, Mellan
Treor b_year2000_2009, Summer, Autumn, Spring, Botten, Mellan Fyror b_year2000_2009, Summer, Autumn, Spring, Botten, Mellan
Det blir tydligt att vissa dummyvariabler under variabelkategorier Byggnadsår,
Säsong och Våning visade sig ha låga F-värden, alltså låg signifikans för modellen.
Genom att exkludera variabler som är mindre signifikanta för modellen är det möjligt att höja R2värdet av modellen vilket vi strävar efter att göra. Undersökning
för varje kovariat görs huruvida exkludering av kovariat xi leder till ett högre R
2.
Även AIC-värden jämförs för alla kovariat, där det has i åtanke att en modell utan ”reporänta” ger ett högre AIC.
Undersökning kring modell utan kovariat xiför alla i där initial är modell med
samtliga kovariat och modell ”- xi” är modell där kovariat xihar exkluderats.
Signifikans enrumslägenheter
Enrumslägenheter AIC R2 R2 Good/Bad
initial 4255.953 0.4606 0.4602 -reporanta 7832.118 0.3809 0.3805 Good -monthly/kvm 4926.619 0.4464 0.4461 Good -h_area 7378.142 0.3916 0.3912 Good -b_elevator 5645.627 0.4309 0.4305 Good -Ort2 4611.770 0.4531 0.4527 Good -Byggnadsår 11421.825 0.2887 0.2884 Good -Säsong 4312.340 0.4593 0.459 Good -Våning 4272.030 0.4602 0.4598 Good Signifikans tvårumslägenheter Tvårumslägenheter AIC R2 R2 Good/Bad initial 21067.85 0.495 0.4948 -reporanta 25775.59 0.4472 0.447 Good -monthly/kvm 25468.68 0.4504 0.4503 Good -h_area 23266.70 0.4732 0.473 Good -b_elevator 24060.38 0.4651 0.4649 Good -Ort2 21417.04 0.4916 0.4914 Good -Byggnadsår 40028.75 0.273 0.2728 Good -Säsong 21106.17 0.4946 0.4944 Good -Våning 21075.44 0.4949 0.4947 Good
Signifikans trerumslägenheter Trerumslägenheter AIC R2 R2 Good/Bad initial 23138.51 0.4887 0.4884 -reporanta 25129.41 0.454 0.4537 Good -monthly/kvm 27722.89 0.4053 0.405 Good -h_area 23176.39 0.4881 0.4878 Good -b_elevator 24376.37 0.4674 0.4671 Good -Ort2 23264.36 0.4866 0.4863 Good -Byggnadsår 36880.50 0.1955 0.1953 Good -Säsong 23137.57 0.4886 0.4884 OK -Våning 23134.83 0.4887 0.4884 OK Signifikans fyrarumslägenheter Fyrarumslägenheter AIC R2 R2 Good/Bad initial 10153.49 0.4522 0.4513 -reporanta 10732.81 0.4249 0.4241 Good -monthly/kvm 12623.11 0.3266 0.3256 Good -h_area 10151.60 0.4522 0.4513 OK -b_elevator 10620.14 0.4303 0.4295 Good -Ort2 10294.04 0.4456 0.4448 Good -Byggnadsår 13554.60 0.2711 0.2705 Good -Säsong 10148.92 0.4521 0.4514 Bad -Våning 10150.96 0.4521 0.4513 OK
Tabellerna visar inte att exkludering av en viss variabel leder till ett högre R2. Trots
det finns det i vissa fall variabler som inte har någon påverkan på R2, exkludering
av dessa erhåller i flesta fall ett lägre AIC värde. Slutsatsen här blir att R2-värdet
inte kan ökas genom att exkludera ett visst kovariat ur modellen.
5.7.1. Sammanfattning för AIC och R
2för modell med/utan
”reporanta”
Enrumslägenheter Tvårumslägenheter Treor Fyror AIC (inital) 4255.953 21067.85 23138.51 10153.49 AIC (-reporanta) 7832.118 25775.59 25129.41 10732.81 R2 (inital) 0.4606 0.495 0.4887 0.4522 R2 (-reporanta) 0.3809 0.4472 0.454 0.4249 R2 (inital) 0.4602 0.4948 0.4884 0.4513 R2 (-reporanta) 0.3805 0.447 0.4537 0.4241
Med variabeln reporanta erhålls det för alla kategorier ett lägre AIC och ett högre
5.8. Heteroskadisticitet
5.8.1. Breusch-Pagan test, Normal Q-Q samt linjäranpassning
Följande resultat fås vid utförandet av Breusch-Pagan testet för existens av heteroskadisticitet:
Enrumslägenheter
studentized Breusch-‐Pagan test
data: p
BP = 1400.897, df = 19, p-‐value < 2.2e-‐16
Tvårumslägenheter
studentized Breusch-‐Pagan test
data: p
BP = 5112.933, df = 19, p-‐value < 2.2e-‐16
Trerumslägenheter
studentized Breusch-‐Pagan test
data: p
BP = 2846.177, df = 19, p-‐value < 2.2e-‐16
Fyrarumslägenheter
studentized Breusch-‐Pagan test
data: p
BP = 1464.676, df = 19, p-‐value < 2.2e-‐16
För samtliga rumskategorier fås ett positivt värde för Breusch-Pagan testet samt ett lågt p-värde vilket visar att heteroskedasticitet förekommer.
Vidare kring heteroskedasticitet undersöktes den sammanslagna modellens Normal Q-Q samt linjäranpassning till datapunkterna.
5.9. Multikollinaritet
5.9.1. Varians Inflations Faktorn, VIF
Via VIF undersöks huruvida multikollinaritet förekommer bland kovariaten.
Enrumslägenheter
reporanta monthly_kvm h_area 1.028465 1.227568 1.123241 b_elevator Ort2 b_year1800_1899 1.131804 1.123654 1.040608 b_year2010_2015 b_year1940_1949 b_year1950_1959 1.065200 1.113810 1.111438 b_year1960_1969 b_year1970_1979 b_year1980_1989 1.073476 1.128927 1.007799 b_year1990_1999 b_year2000_2009 Spring 1.074641 1.154767 1.601265 Summer Autumn Botten 1.516722 1.605075 1.072289 Topp
1.079465
Tvårumslägenheter
reporanta monthly_kvm h_area 1.025366 1.455698 1.218675 b_elevator Ort2 b_year1800_1899 1.380455 1.101036 1.113613 b_year2010_2015 b_year1940_1949 b_year1950_1959 1.167472 1.509670 1.247005 b_year1960_1969 b_year1970_1979 b_year1980_1989 1.172562 1.101953 1.157177 b_year1990_1999 b_year2000_2009 Spring 1.336488 1.484380 1.598694 Summer Autumn Botten 1.496022 1.600935 1.063924 Topp 1.084115
Trerumslägenheter
reporanta monthly_kvm h_area 1.033689 1.489389 1.191750 b_elevator Ort2 b_year1800_1899 1.342739 1.075174 1.215408 b_year2010_2015 b_year1940_1949 b_year1950_1959 1.444972 1.606127 1.863868 b_year1960_1969 b_year1970_1979 b_year1980_1989 1.720565 1.562443 1.456438 b_year1990_1999 b_year2000_2009 Spring 1.728727 2.216170 1.605148 Summer Autumn Botten 1.496090 1.601900 1.067258 Topp
1.091640
Fyrarumslägenheter
reporanta monthly_kvm h_area 1.043101 1.563991 1.155969 b_elevator Ort2 b_year1800_1899 1.243268 1.070715 1.247696 b_year2010_2015 b_year1940_1949 b_year1950_1959 1.773905 1.210197 1.668957 b_year1960_1969 b_year1970_1979 b_year1980_1989 1.732934 1.403235 1.626981 b_year1990_1999 b_year2000_2009 Spring 2.074621 2.625715 1.623093 Summer Autumn Botten 1.479479 1.622430 1.081116 Topp
1.069900
Ovan observeras att samtliga VIF-värden är mindre än 10 vilket indikerar att multikollinaritet inte existerar.
5.10. Hypotesprövning
Samtliga hypotesprövningar som ställts upp resulterar i skilda resultat.
För hypotesprövning 1 fås ett p-värde på 5.602e-06 vilket gör att vi kan förkasta nollhypotesen om βreporänta _ enrumslägenheter=βreporänta _ tvårumslägenheterpå 5% signifikansnivån. Hypotesprövning 2 resulterar i ett p-värde på 0.006374. Även för denna
hypotesprövning kan nollhypotesen om likadana β -värdena förkastas på signifikansnivån 5%.
Hypotesprövning 3 visar att nollhypotesen om
βreporänta _ enrumslägenheter =βreporänta _ fyrarumslägenheter kan förkastas på signifikansnivån 5% då
p-värdet är 5.674e-06.
För hypotesprövning 4 fås ett p-värde på 0.1271 vilket innebär att nollhypotesen inte kan förkastas med säkerhet på signifikansnivån 5%.
Hypotesprövning 5 resulterar i ett p-värde på 0.1085 vilket innebär att även denna
nollhypotes inte kan förkastas på en signifikansnivå på 5%.
Hypotesprövning 6 ger ett p-värde på 0.01215 vilket innebär att nollhypotesen om
6. Diskussion
6.1. Analys av resultat
Från de utförda regressionsanalyserna kan det observeras hur de valda kovariaten påverkar bostadspriset. I denna studie har fokus lagts just på reporäntan samt hur den påverkar priserna av bostäder av olika storlek.
Ur den sammanslagna regressionsanalysen kan det konstateras att β -värdena för reporäntekovariatet skiljer sig åt för de olika lägenhetskategorierna. De
hypotesprövningar som gjorts, för undersökning kring huruvida man kan förkasta en hypotes om attβ-värdena för de olika lägenhetskategorierna är likadana, visar blandade resultat. Hypotesprövningarna visar att hypoteser för att β-värdena för reporäntan för enrumslägenheter gentemot två-, tre- samt fyrarumslägenheter ska vara likadana kan förkastas med den valda signifikansnivån. Utöver detta kan hypotesen om likadan β-värden för reporänta för trerums- mot fyrarumslägenheter förkastas på den valda signifikansnivån. Dock kan det inte med säkerhet förkastas att β-värdena för reporänta är likadana för tvårumslägenheter mot tre- samt fyrarumslägenheter med 5% signifikansnivå. Utifrån dessa resultat för
hypotesprövningar kan det alltså observeras att reporäntan faktiskt har en skild påverkan på bostadspris för de olika lägenhetsstorlekarna, det kan konstateras attβ -värdena inte är lika för de olika kategorierna.
Reporäntan påverkar alltså modellerna för de olika stora lägenheterna olika mycket. Skillnaden är inte enorm men påtaglig. Vidare framgår det ur resultaten hur
resterande kovariat påverkar modellerna, Säsong till exempel tyder på att det är mest givande att sälja en lägenhet under hösten och beroende på lägenhetens storlek är det bäst att köpa på sommaren för trerumslägenheter och fyrarumslägenheter samt våren för enrumslägenheter och tvårumslägenheter, med vinter som referenspunkt.
En punkt som är viktigt att ta hänsyn till är förklaringsgraden R2 för respektive
modell. I de regressionsanalyser som utförs erhålls ett R2-värde kring 0.53 för
samtliga modell vilket leder till att man inte med säkerhet kan påstå att datat ligger nära regressionlinjen, alltså är inte residualerna minimerade på effektivaste möjliga sätt. Baserat på detta görs en undersökning kring huruvida R2
-värdet ökar vid exkludering av mindre signifikanta kovariat. Resultaten av denna påbyggande undersökning bidrar till att det konkluderas att R2-värdet inte ökar markant. Ett
antagande kan vara att R2-värdet ökar vid tillägg av nya kovariat av signifikans då
inkludering av kovariat av mindre signifikans, till exempel Säsong och Våning, inte bidrar till ett högre R2-värde. Efter att ha noterat signifikansvärdena för de olika
kovariaten kan det konstateras att vissa kovariat är av högre signifikans än andra för de olika stora bostadskategorierna. Arean är till exempel av lägre signifikans för trerums- och fyrarumslägenheter än för enrums- samt tvårumslägenheter.
Visserligen är ett R2-värde alltid önskvärt men att R2-värdet inte ligger närmare 1 i
dessa fall kan accepteras då syftet med analysen är att verifiera huruvida reporäntan påverkar de olika stora lägenheterna olika mycket.