• No results found

EN UNDERSÖKNING KRING PRISPÅVERKAN VID INRÄTTANDE AV EN NYBYGGNATION.

N/A
N/A
Protected

Academic year: 2021

Share "EN UNDERSÖKNING KRING PRISPÅVERKAN VID INRÄTTANDE AV EN NYBYGGNATION."

Copied!
56
0
0

Loading.... (view fulltext now)

Full text

(1)

EN UNDERS ¨

OKNING KRING PRISP˚

AVERKAN

VID INR ¨

ATTANDE AV EN NYBYGGNATION

Kandidatexamensarbete vid

KTH Matematik avd. Matematisk Statistik Handledare: Gunnar Englund

Stockholm, 2013

AV

Markus Andersson

Nirankar Singh

(2)
(3)

Abstract

This report is aimed at building companies and brokers who are interested to see how the trends in prices are on older buildings, near a new construction project. It may be that it is easier for construction companies to get through the planning permission if it can be shown that the new construction pro-jects have a positive impact on the price of existing adjacent buildings. The study may be viewed as a pilot project where this kind of reports are rare and probably not done before in Sweden. The model must be extended to more areas in order to ensure the result of higher significance.

The conclusion about the study is that it is an indication of positive price impact, but the modeling and the approach has been the central focus of the study. It is likely to assume that in order to make a better model, even more factors have be taken into account. For example, it is possible that when a construction project is built, it can be improved communications to the area, new stores can be built or similar improvements, so even such aspects would be needed for a more rigorous study.

(4)

Sammanfattning

Den här rapporten är riktad till byggbolag och mäklare som är intresserade av att se hur prisutvecklingen på äldre bebyggelse är kring ett nybyggnads-projekt. Det kan tänkas att det är lättare för byggbolag att få igenom bygglov om det kan påvisas att nybyggnadsprojekt har en positiv inverkan på priset gällande närliggande byggnation. Studien får dock ses som ett pilotprojekt då arbeten av den här typen är ovanliga och troligen inte utförda tidigare i Sverige. Modellen behöver utvidgas med fler områden för att kunna säker-ställa resultatet med högre signifikans.

Slutsatsen kring studien är att det finns indikation på positiv prispåverkan, men modelleringen och tillvägagångssättet har varit det centrala i studien. Det är troligt att anta att för att göra en så god modell som möjligt behövs även fler faktorer beaktas. Exempelvis kan det tänkas att då ett nybygg-nadsprojekt byggs, förbättras även kommunikationerna till området det kan byggas nya butiker eller motsvarande förbättringar, så även sådana aspekter skulle behövas för en mer rigorös studie.

Keywords: prediktion, multipel linjär regression, nyproduktion, bostadsmark-nad, Valueguard, R-programming.

(5)

Förord

Rapporten är skriven som en del av kandidatexamensarbetet vid SCI-skolan vid Kungliga Tekniska Högskolan med Matematikinstitutionen på KTH av-delning Matematisk Statistik som beställare.

Studien har utförts av Markus Andersson och Nirankar Singh, studenter på programmet Farkostteknik. Handledare under projektet har varit Gun-nar Englund. Projektarbetet har bestått av fyra delar: problemformulering, datainsamling, matematisk modellering i programspråket R samt rapport-skrivning. Den största utmaningen samt huvudpoängen i projektet har varit den matematiska modelleringen.

Vi vill tacka vår Handledare Gunnar Englund för alla tips, råd och diskussio-ner under projektets gång. Vi vill även ägna ett tack till Lars-Erik Ericsson från Valueguard för hjälp med problemformulering och tillhandahållandet av data till studien. Vi vill även tacka Harald Lang på Matematikinstitutionen på KTH avd. Matematisk Statistik för hjälp med en del av modelleringen.

Markus Andersson och Nirankar Singh Stockholm 2013

(6)

Innehåll

1 Introduktion 1

2 Terminologi 3

2.1 Regressionsanalys . . . 3

Antaganden . . . 3

2.1.1 Multipel linjär regression . . . 4

Linjär algebra . . . 4 Prediktion . . . 5 2.2 Heteroskedasticitet . . . 5 Breusch-Pagan Test . . . 6 Robust regression . . . 6 2.3 Multikollinearitet . . . 7

VIF (Variance Inflation Factor) . . . 7

3 Metod 9 3.1 Grundekvationen . . . 9

3.1.1 Funktioner och ”packages” i R . . . 11

3.1.2 White’s Consistent Variance Estimator . . . 11

4 Analys 13 4.1 Solna . . . 13 4.1.1 Filmstaden . . . 14 Filmstaden 2005-2007 . . . 14 Filmstaden 2010-2013 . . . 16 4.1.2 Resultat . . . 19 4.1.3 Råsunda . . . 19 Råsunda 2005-2007 . . . 19 Råsunda 2010-2013 . . . 21 4.1.4 Resultat . . . 23 4.2 Kungsholmen . . . 23 4.2.1 Lindhagen . . . 23 Lindhagen 2005-2007 . . . 23 Lindhagen 2010-2013 . . . 26

(7)

4.2.2 Resultat . . . 28

4.2.3 Kungsholmen innanför tullarna . . . 28

Kungsholmen 2005-2007 . . . 28 Kungsholmen 2010-2013 . . . 30 4.2.4 Resultat . . . 32 4.3 Hägersten . . . 32 4.3.1 Telefonplan . . . 32 Telefonplan 2005-2007 . . . 32 Telefonplan 2010-2013 . . . 34 4.3.2 Resultat . . . 36

4.3.3 Midsommarkransen och Aspudden . . . 36

Midsommarkrans/Aspudden 2005-2007 . . . 36 Midsommar/Aspudden 2010-2013 . . . 38 4.3.4 Resultat . . . 41 5 Diskussion 43 5.1 Utvecklingsmöjligheter . . . 43 5.2 Val av programspråk . . . 43 6 Referenser 45 7 Appendix 47 7.1 R-kod . . . 47 7.2 Figurer . . . 48

(8)

Kapitel 1

Introduktion

I det här projektet har en analys utförts där prispåverkan på närområdet varit mål för undersökning, när ett nybyggnadsprojekt byggs invid äldre be-byggelse. En datafil med ca 237 000 försäljningar under åren 2005-2013 har bearbetats i Excel och sedan importerats till R1, där regressionsanalyser

ge-nomförts. Det är tre områden i Stockholmsregionen som har analyserats där nybyggnadsprojekt varit färdigställda år 2009; Gamla Filmstaden i Solna, Lindhagensterrassen på Kungsholmen och Telefonplan i Hägersten.

Idén för att påvisa prispåverkan är genom multipel prediktion, då för var och ett av områdena genom att göra en regression på data innan nybygg-nadsprojektet är färdigställt (år 2005-2007) och en regression efter det är färdigställt (år 2010-2013). Därefter görs en prediktion på en försäljning år 2005 och jämförs med en prediktion år 2013, indatan i prediktionen är i öv-rigt samma för var och ett av områdena, bortsett från försäljningsår där den tidigare modellen är styrande (medelvärden från dataurvalet har använts). De områden som har används som index för respektive område är Råsunda i Solna, Kungsholmen innanför tullarna och Midsommarkransen/Aspudden i Hägersten.

Den procentuella prisökningen i närområdet till varje nybyggnadsprojekt har jämförts mot ett område något längre ifrån nybyggnadsprojektet (de områden som verkat som indexerande). Viktigt att poängtera är att endast ett urval av äldre bebyggelse (byggd innan år 2000) har tagits med i dataur-valet, på sätt har det faktumet att byggnadsår följer en icke-linjär struktur dämpats en aning.

(9)

I områdena närmast nybyggnadsprojekten har prisbilden varit homogen och det har varit viktigt att välja indexerande områden på sådant sätt att pris-bilden även där har varit av homogen art, för att få en så god prediktion som möjligt. Om det är så att prisbilden på urvalet varierar kraftigt uppkommer problem med så kallade ”outliers” som försämrar kvalitén av data och kan orsaka en felaktig prediktion.

Valueguard

Studien har utförts i samarbete Valueguard i Uppsala som har tiilhandahållit data och hjälpt till med problemformuleringen.

”Valueguard arbetar för att skapa nya finansiella produkter för bostads-marknaden. Vi tillhandahåller också analyser och informationstjänster. Som grund för många av våra produkter och tjänster ligger ett prisindex för bo-städer - Nasdaq OMX Valueguard-KTH Housing Index (HOX®).

HOX Index har utvecklats i samarbete med KTH, det distribueras av Nasdaq OMX och det bygger på data levererad av bl.a. Svensk Mäklarstatistik AB och Lantmäteriet.” 2

(10)

Kapitel 2

Terminologi

2.1 Regressionsanalys

Regression är en gren inom statistiken där målet är att skapa en matema-tisk modell eller en funktion som anpassas efter observerad data. Man är då intresserad av om det finns linjärt samband mellan två variabler i fallet med en enkel linjär regression[1]. Vid enkel linjär regression utgår man från att en rät linje ska anpassas till uppmätt data[2].

Den enkla linjära regressionsmodellen ges av

Y = 0+ 1X. (2.1)

där 0 är skärning med y-axeln, kallas även för intercept och 1 är lutningen

på den räta linjen. Den beroende och även s.k responsvariabel som påverkas är Y , medan den oberoende och förklarande variabeln som påverkar är X. Antaganden

För att kunna dra slutsatsen av analysen i modellen måste vissa antagan-den göras. Den linjära regressionsmodellen bygger på några grundläggande antaganden[3] som måste vara uppfyllda, som lyder:

1. Den beroende variabeln kan skrivas som en linjär funktion av K 1 stycken förklarande variabler x2i, x3i, . . . , xKi, ett intercept 0 samt en

residual ✏i.

Yi= 0+ 1iX1i+ 2iX2i+ . . . + KXKi+ ✏i (2.2)

2. Det förväntade värdet av residualen ✏i är lika med 0.

(11)

3. Residualen ✏i är homoskedastisk; ✏i har samma varians för alla i. 2= V ar(✏

i) (2.4)

4. Residualen ✏i har en normalfördelning.

✏i⇠ N(0, 2) (2.5)

2.1.1 Multipel linjär regression

Linjär algebra

När det är två eller fler förklarande variabler i en modell tillämpar man multipel regression. Det är en teknik med vilken man kan undersöka om det finns ett statistiskt samband mellan en responsvariabel Y och de förklarande variablerna Xi där i = 1 . . . n.

Den multipla linjära regressionsmodellen ges av

Y = 0+ 1X1+ 2X2+ . . . + nXn+ e (2.6)

där e är feltermen, som även kallas för residualen.

De estimerade koefficienterna ˆi i = 1 . . . n, skattas med OLS estimering

(Ordinary Least Squares) av genom matrisoperationer.

ˆ = (XtX) 1XtY (2.7) Y = 2 6 6 6 4 y1 y2 ... yn 3 7 7 7 5 X = 2 6 6 6 6 6 4 1 x11 x12 · · · x1k 1 x21 x22 · · · x2k 1 x31 x32 · · · x3k ... ... ... ... ... 1 xn1 xn2 · · · xnk 3 7 7 7 7 7 5 ˆ = 2 6 6 6 4 1 2 ... k 3 7 7 7 5

där ˆ är värdet av som minimerar summan av kvadraterna ˆete =ˆ |ˆe|2

av residualerna ˆe = Y X ˆ. Där även normalekvationen[13] Xtˆe = 0

an-vänds.

Kovariansmatrisen för ˆ beräknas på följande sätt

(12)

En väntevärdesriktig skattning av 2 är

s2 = 1 n k 1|ˆe|

2 (2.9)

där n står för antal observationer och k för antalet kovariater. En estimering av kovariansmatrisen blir således

cov( ˆ|X) = (XtX) 1s2 (2.10) Prediktion

Den linjära modellen har flera användningsområden, där bl.a till predik-tion[13]. Prediktion är en metod att estimera framtida och därmed okända värden, baserat på tidigare kända värden[14]. Med en given radvektor med förklarande variablerna Xi där i = 1 . . . n, kan predikterade värden på Y

estimeras med Yp genom

Yp= Xiˆ (2.11)

2.2 Heteroskedasticitet

Det tredje antagandet i den linjära regressionsmodellen kräver att residualen har likformig varians dvs att residualen är homoskedastisk. När det här an-tagandet inte uppfylls har vi något som kallas för heteroskedasticitet, d.v.s. att residualen ses som tagen ur en annan distribution för varje observation, se Figur 2.2.1.

(13)

mot en förklarande variabel.

Heteroskedasticitet kan ses visuellt i en graf där residualerna plottas mot de förklarande variabelerna, för att se om spridningen hos residualerna beror på variablerna. Heteroskedasticitet kan även visas med hjälp av en rad olika tes-ter så som The Eyeball Test, The Goldfeld-Quandt Test, The Breusch-Pagan Test och The Whites Test.

Konsekvensen med att använda en modell med data som är heteroskedastisk är att hypotesprövningar, intervallestimeringar och det kalkylerade standard-felet för minsta kvadrat estimatorerna blir felaktiga, d.v.s. att standardstandard-felet får en bias[4]. Bias av en estimator är differansen mellan estimatorns för-väntade värde och det sanna värdet av parametern som estimeras. Själva koefficienterna, d.v.s. de estimerade i påverkas inte av att modellen

inne-håller data som är heteroskedastisk. Breusch-Pagan Test

För att testa om heteroskedasticitet finns närvarande i given data har Breusch-Pagan Test användts. Breusch-Breusch-Pagan testet innebär att man estimerar mo-dellen i ekvation (2.2) genom att göra en OLS regression på momo-dellen för att få residualerna ˆu. Residualerna kvadreras ˆu2 för att negativa värden inte

ska ta ut positiva värden. Dessa residualer används i regressionen mot de förklarande variablerna (X1, X2, X3. . . Xn).

Regressionen blir då ˆ

u2i = ↵0+ ↵1X1+ ↵2X2+ . . . + ↵nXn+ ✏ (2.12)

För att avgöra om heteroskedastisitet är närvarande testar man då lutningen på variablerna mot noll.

Hypotesen[5] blir således

H0: a1 =a2 = ... =an= 0 (2.13)

H1 : n˚agot ↵i 6= 0 d¨ar i = 1 . . . n (2.14)

Om p-värdet är litet beroende på vald signifikansnivå, förkastas nollhypote-sen H0 om homoskedasticitet.

Robust regression

Vid misstanke om heteroskedasticitet kan två strategier användas, den första är GLS (Generalized Least Square) estimatorn[6]. GLS estimatorn har före-delen att kunna kompensera fullt ut för heteroskedasticitet och det här gör

(14)

att GLS är asymptotiskt effektivare relativt till OLS. Den stora nackdelen med GLS är att formen på heteroskedasticiteten måste vara känd, vilket kan vara svårt att veta i vissa fall. Den andra strategin är att använda metoden robust standard errors. Med den här metoden behöver man inte veta formen på heteroskedasticiteten.

Vanliga OLS:en antar att residualen är oberoende och normalfördelad. Som det nämndes ovan, så gör heteroskedasticitet att standardfelet får en bias. Det här problemet löses med robust regression i det här fallet. Man kan säga att modellen estimeras med OLS, men för att estimera standard-felet används robusta standard error, som ser till att ordna de inkonsistenta standardfelen[7].

2.3 Multikollinearitet

I en regressionsmodell försöker man beskriva den beroende variabeln Y med de oberoende variablerna (X1, X2, X3. . . Xn), men i vissa fall uppstår det ett

problem då minst två eller flera av de oberoende variablerna är korrelerade med varandra. Det här kallas för multikollinearitet, problemet med det är att det inte går att skilja på “effekten” från de korrelerade variablerna på den beroende variabeln.

Multikollinearitet beror inte på någon teoretisk eller aktuell linjär relation mellan någon regressand, utan endast på en approximativt linjär relation mellan de oberoende variablerna i just den data man har till hands. Med da-ta från ett kontrollerad experimentet kan man eliminera multikollinearitet, men det är sällan man har den här möjligheten[15].

VIF (Variance Inflation Factor)

För att ta reda på om multikollinearitet finns i aktuell data, kan korrelations-matrisen vara användbar. Korrelationskorrelations-matrisen är kvadratisk, symmetrisk och har ettor på diagonalen p.g.a. att elementet i kolumnen är korrelerad med sig själv. Matrisen beskriver alltså korrelationen mellan de oberoende variablerna. Inversen av korrelationsmatrisen är speciellt användbar till att upptäcka multikolliniearitet, då diagonal elementen på matrisen blir varians inflations faktorer så kallade V IFi, och ges av (1 R2i) 1där R2i är R-kvadrat

från regressionens i:te variabel.

R-kvadrat förklarar om hur verkligt det är att variablerna är beroende av varandra och inte av något annat[8]. VIF-värdet beräknas för varje variabel (X1, X2, X3. . . Xn) och, om modellen i ekvation (2.2) betraktas kan

VIF-värden generellt beräknas[9] på följaden sätt:

(15)

att ha den oberoende variabeln i vänster-ledet och sedan utföra OLS. Det här görs för alla variabler.

om k = 1:

X1 = 0+ 2X2+ . . . + kXk+ ✏. (2.15)

Sedan beräknas V IFi genom

V IFi =

1 (1 R2

i)

(2.16) Tumregeln säger att om det erhållna värdet av V IFi > 10indikerar att

ak-tuell data har skadlig multikollinearitet.

När given data innehåller multikollinearitet påverkar det variansen på de OLS estimerade parametrarna till de multikollineara variablerna, det här p.g.a att det inte finns tillräckligt med variation i variabeln för att kunna visa vilken effekt den har på den beroende variabeln [10]. Högre korrelation mellan de oberoende variablerna ger mindre information till OLS regressio-nen för att estimera parametrarna, vilket leder till högre varians.

Multikollinaritet går att ordna till genom att antingen tillföra mer informa-tion/mer data eller bortse från faktumet att multikolliniearitet finns. Genom att tillföra mer data ökar man informationen för OLS estimatorn som leder till att variansen minskar, multikolliniaritet är ett data problem och genom att tillföra mer data som inte innehåller multikolliniearietet minskar man problemet med det. Det går även att ta bort en förklarande variabel i mo-dellen för att bryta korrelationen mellan två eller flera variabler, den andra metoden är att inte göra någonting[10].

(16)

Kapitel 3

Metod

3.1 Grundekvationen

Den data som analysen grundar sig på har tillhandahållits från Valueguard med 231 916 stycken försäljningar i Stockholmsregionen mellan åren 2005-2013. Ur det här datasetet har en selektion av sex olika områden, (tre nära ett nybyggnadsprojekt samt tre indexerande områden) vid två olika tidspe-rioder.

Vid undersökning av prispåverkan på äldre bebyggelse vid inrättandet av en nybyggnation, samt det indexerande området, har en och samma grun-dekvation använts. Anledningen varför en och samma grungrun-dekvation har använts är att totalt tolv olika modeller har jämförts och grundekvationen kan ses som en gemensam nämnare mellan modellerna. Kovariaterna som ingår i grundekvationen är de viktigaste komponenterna vid prissättning av en bostadsrätt.

log t price = 0+(h area) 1+(monthlyf ee h area) 2+(h rooms) 3+

(h f loor no elevator) 4+ (h f loor elevator) 5+ (b elevator) 6+

(b year) 7+ (year nr) 8+ ✏ (3.1)

Förklaring av variabler och förväntat tecken på deras estimerade koeffici-ent ˆ :

• log t price = försäljningspriset logaritmerat (det här för att dämpa effekten av hetroskedaticitet)

(17)

• monthlyfee h area = månadsavgift per kvadratmeter, förväntat tecken –

• h rooms = antalet rum i bostaden, förväntat tecken +

• h floor no elevator = bostadens våningsplan när det inte finns hiss i fastigheten, förväntat tecken –

• h floor elevator = bostadens våningsplan då det finns hiss i fastig-heten, förväntat tecken +

• b elevator = en dummyvariabel, 1 om det finns hiss i fastigheten, 0 om det inte finns hiss, förväntat tecken +

• b year = byggnadsår, förväntat tecken – (det här är approximativt eftersom max(b year) = 2000, med lägst prisnivå ~ -60,-70-tal) • year nr = försäljningsår, förväntat tecken +

Det hade varit önskevärt att ha med kovariaten balkong i grundekvationen. Tyvärr var kvaliteten av informationen kring det bristfällande i datasetet, därav togs kovariaten balkong bort från grundekvationen. Inledningsvis an-vändes variabeln monthlyfee, d.v.s. månadsavgift som en förklarande varia-bel. Problemet som uppstod då var att månadsavgiften och bostadens area var korrelerade. För att kringgå det här faktumet, transformerades variabeln till monthlyfee_h_area d.v.s. månadsavgift per kvadratmeter.

I övrigt har transformationer av de förklarande variabler som uppvisat fel förväntat tecken utförts genom att lägga till kvadrerade variabler i de regres-sionsmodeller där problemen uppstått. Det förväntade tecknet på b year är approximativt negativt eftersom det endast tagits med objekt som är bygg-da innan år 2000 och den absoluta majoriteten av alla objekt i urvalet av områden är byggda på 1950-talet och tidigare.

I analysen av det indexerande området Midsommarkransen/Aspudden upp-täcktes ”outliers” år 2005. Ett tiotal objekt hade väldigt låga kvadratme-terpriser, så låga som 7-10000 kr/kvm medan de övriga objekten samma år hade kvadratmeterpriser mellan 20-29000 kr/kvm. Objekt på samma adress där de låga priserna var närvarande år 2005 låg i ”normal” prisnivå såväl 2007 som 2010-2013. Det är troligt att anta att en ombildning har skett i de fastigheter där de onormalt låga priserna var närvarande år 2005, problemet löstes genom att utesluta de ”outliers” som orsakade problem ur den data som använts i området.

Ett annat problem vid selektion av data till de områden, där analyser utförts, har varit att välja ut den data som önskats med hjälp av kartkoordinater.

(18)

I vissa fall, exempelvis vid selektion av data i området Midsommarkran-sen/Aspudden kom objekt från Nybodahöjden i Liljeholmen med i urvalet p.g.a. att dess geografiska närhet. Problemet som uppstod i det här fallet var att det var stora variationer både prismässigt och arkitektoniskt samt att området är beläget på andra sidan av Essingeleden i jämförelse med Midsommarkransen/Aspudden. Även i ett fall som det här har de objekt som legat utanför ramarna av det definierade området plockats bort även i det här fallet, då de gav alldeles för lågt predikterat värde av ett typobjekt. Ett problem som uppstått vid hanteringen av data var att det i vissa fall behövde datan ”tvättas”, d.v.s. att våningsplanet stod skrivet i fel kolumn, information kring hurvida det finns hiss eller inte i fastigheten behövdes korrigeras. Det var oftast inget problem, eftersom information kring fastig-heten fanns på objekt med samma adress eller gata. Det var dock relativt tidskrävande att gå igenom flera tusen objekt.

3.1.1 Funktioner och ”packages” i R

De funktioner som har använts i regressionsanalysen har varit lm, summa-ry (då det inte funnits hetroskedasticitet), bptest, vif samt en funktion som heter summaryR1som ger rätt standardavvikelser och signifikans på de

skat-tade parametrarna när heteroskedasticitet är närvarande.

Exempel på hur analysen för de olika områdena finns visat i appendix. De ”packages” som varit nödvändiga för att utföra den analys som krävts i pro-jektet har varit AER (Applied Econometrics with R), datasets, graphics, grDevices, methods, stats och utils.

3.1.2 White’s Consistent Variance Estimator

Vid faktumet av heteroskedasticitet påverkas standardavvikelserna och sig-nifikansen av de estimerade koefficienterna i. Algebraiskt tas

kovariansma-trisen Cov( ˆ) fram på följande sätt[13]. Cov( ˆ) = (XtX) 1( n X i=1 ˆ e2ixtixi)(XtX) 1 (3.2)

I programmet R används White’s estimator i filen SummaryR2 i det fall där

heteroskedastisitet är närvarande.

1För SummaryR kod, se Apendix 2Se bilaga i Apendix

(19)
(20)

Kapitel 4

Analys

Utifrån de resultat som har uppkommit vid regressionsanalyserna i R har slutsatser i projektet varit möjliga. Resultaten visas i område för område, tiden före inrättandet av en nybyggnation (2005-2007) samt tiden efter (2010-2013).

Determinationskoefficienten R2 ligger i intervallet [ 0 1 ] och antar

vär-det 1 när alla residualer är lika med noll. I samtliga områden där analysen genomförts har värdena på R2 legat över 0.8 vilket kan anses ge en god

förutsättnng att göra en bra prediktion.

4.1 Solna

I regressionsanalysen av området Gamla Filmstaden blev prisförändringen mellan år 2005-2013, 35,2% medan området vi haft som jämförbart index, Råsunda ökade under samma period 60.5% i pris. Det går därför inte att påvisa någon positiv prispåverkan i det här området. Det finns olika tolk-ningar av det här resultatet, det första är att det faktiskt inte har påverkat priset efter att de nya kvarteren är byggda. Dämpningen av prisutvecklingen jämfört mot index kan bero på att det som tidigare varit ett parkområde nu exploaterats. En annan teori som är mer trolig är att den prispåverkan in-om närin-området till Gamla Filmstaden redan börjat ske mellan år 2002-2004 eftersom första etappen: Filmstaden 16, bostadskvarter A, Ingrid Bergmans väg 3-23, byggdes under den här tiden, den sjunde och sista etappen i pro-jektet färdigställdes under år 2009: Filmstaden 20, bostadskvarter E, Edvin Adolphsons väg 2-4, Viktor Sjöströms väg 2-10 [11].

Det är därför troligt att anta följande, för att ha fått ett mer statistiskt säkerställt resultat skulle perioden före nybyggnadsprojektet ha varit innan år 2002, exempelvis mellan 1999-2001, tyvärr har det dataurvalet som har tillhandahållits i projektet inte haft tidigare försäljningsår än 2005 vilket ha-de behövts för att göra en så god analys som möjligt. Det kan vara så att man

(21)

innan år 2005 när mätningarna började gick in i en kraftig prisutvecklingsfas som sedan planades ut en aning.

4.1.1 Filmstaden

Filmstaden 2005-2007

Variablerna h floor elevator samt h floor no elevator visade fel förvän-tat tecken efter att en regression med grundekvationen, ekvation (3.1) utförts. Ekvationen med transformerade variabler blev således:

log t price = 0+(h area) 1+(monthlyf ee h area) 2+(h rooms) 3+

(h f loor no elevator) 4+(h f loor elevator) 5+(b elevator) 6+(b year) 7+

(year nr) 8+ (h f loor elevator)2 9+ (h f loor no elevator)2 10+ ✏

(4.1)

S t u d e n t i z e d Breusch Pagan t e s t

BP = 1 0 . 5 7 6 , df = 10 , p value = 0.3915

Figur 3.1.1: Normal Q-Q plotten påvisar att residualerna med god approxi-mation följer en normalfördelning.

(22)

Figur 3.1.2: Residualdatan illustrerad, x-axeln motsvarar logaritmerad för-säljningspris.

R e s i d u a l s :

Min 1Q Median 3Q Max 0.32578 0.06705 0.00990 0.08265 0.27164 C o e f f i c i e n t s :

Estimate Std . Error t value Pr( >| t | ) ( I n t e r c e p t ) 2.798 e+02 2 . 7 9 8 e+01 10.000 < 2e 16 ∗∗∗ h_area 1 . 2 8 1 e 02 2 . 7 5 1 e 03 4 . 6 5 8 9 . 4 8 e 06 ∗∗∗ monthlyfee_h_area 1.884 e 03 5 . 3 9 3 e 03 0.349 0.7275 h_rooms 3 . 9 6 7 e 02 5 . 7 8 9 e 02 0 . 6 8 5 0.4947 b_year 1.750 e 03 2 . 8 9 7 e 03 0.604 0.5471 h_floor_no_elevator 1.852 e 01 1 . 5 1 5 e 01 1.222 0.2245 h _ f l o o r _ e l e v a t o r 5 . 2 1 5 e 02 3 . 1 1 8 e 02 1 . 6 7 3 0.0974 . b_elevator 1.340 e 01 1 . 7 8 1 e 01 0.752 0.4535 year_nr 1 . 4 8 0 e 01 1 . 4 1 0 e 02 10.497 < 2e 16 ∗∗∗ I ( h _ f l o o r _ e l e v a t o r ^2) 8.622 e 03 4 . 4 1 6 e 03 1.952 0.0536 . I ( h_floor_no_elevator ^2) 3 . 5 2 2 e 02 2 . 6 4 9 e 02 1 . 3 3 0 0.1866 S i g n i f . codes : 0 ∗∗∗ 0 . 0 0 1 ∗∗ 0 . 0 1 ∗ 0 . 0 5 . 0 . 1 1

Residual standard e r r o r : 0.1191 on 104 d e g r e e s o f freedom M u l t i p l e R squared : 0 . 8 5 5 2 , Adjusted R squared : 0.8412 F s t a t i s t i c : 6 1 . 4 1 on 10 and 104 DF, p value : < 2 . 2 e 16

-De viktigaste kovariaterna i den här regressionen var h area och year nr som hade väldigt hög signifikans, h floor elevator och h floor elevator2

påverkar även prediktionen med relativt hög signifikans[12]. Estimate är vär-det på de skattade koefficienterna ˆi i = 1 . . . n, se ekvation (2.7).

Std. Error är standardavvikelsen som tas fram genom att ta roten ur di-agonalelementen i kovariansmatrisen se ekvation (2.8)

(23)

P r(>|t|) står för signifikansen, där ett lägre värde ger hög signifikans. VIF v a l u e s 17.213306 h_area 2.418229 monthlyfee_h_area 14.910277 h_rooms 1.405441 b_year 60.355157 h_floor_no_elevator 22.235252 h _ f l o o r _ e l e v a t o r 8.631195 b_elevator 1.052268 year_nr 20.621884 h _ f l o o r _ e l e v a t o r ^2 35.086636 h_floor_no_elevator ^2

-Eftersom h area och h rooms har tämligen höga VIF-värden kan det antas att de är korrelerade en aning, det hade gått att transformera dessa variab-ler, exempelvis genom att kalla en variabel h area rooms dvs. kvadratmeter per rum.

Men eftersom det inte var något väldigt stort värde, som VIF-värdena antog samt att grundekvationen ekvation (3.1) inte skulle avvika mellan de olika områdena bedömdes den här transformationen inte vara av betydande art.

Att h floor elevator och h floor no elevator har höga VIF värden beror på att de även lagts till samma kvadrerade variabler i modellem p.g.a. att fel förväntat tecken.

Preds

h_area monthlyfee_h_area h_rooms 55 50.90909 2 b_year h _ f l o o r _ e l e v a t o r h_floor_no_elevator 1949 3 0 b_elevator year_nr 1 2005 > exp ( p r e d i c t (M2, newdata=preds ) ) 1412307 Filmstaden 2010-2013

Variablerna monthlyfee h area samt year nr visade fel förväntat tecken efter att en regression med grundekvationen ekvation (3.1) utförts. Ekvatio-nen med transformerade variabler blev därmed på följande form:

(24)

log t price = 0+(h area) 1+(monthlf ee h area) 2+(h rooms) 3+

(h f loor no elevator) 4+ (h f loor elevator) 5+ (b elevator) 6+

(b year) 7+(year nr) 8+(monthlyf ee h area)2 9+(year nr)2 10+✏

(4.2)

S t u d e n t i z e d Breusch Pagan t e s t

BP = 3 . 1 3 1 4 , df = 10 , p value = 0.9782

Figur 3.1.3: Normal Q-Q plotten påvisar att residualerna med god approxi-mation följer en normalfördelning.

Figur 3.1.4: Residualdatan illustrerad, x-axeln motsvarar logaritmerad för-säljningspris.

R e s i d u a l s :

Min 1Q Median 3Q Max 0.59455 0.05736 0.00887 0.06486 0.24306

(25)

C o e f f i c i e n t s :

Estimate Std . Error t value Pr( >| t | ) ( I n t e r c e p t ) 3.771 e+04 4 . 3 3 9 e+04 0.869 0.386197 h_area 1 . 2 9 4 e 02 1 . 4 8 6 e 03 8 . 7 1 0 4 . 6 2 e 15 ∗∗∗ monthlyfee_h_area 8 . 6 4 8 e 03 2 . 2 5 8 e 02 0 . 3 8 3 0.702285 h_rooms 1 . 1 3 2 e 02 3 . 0 2 1 e 02 0 . 3 7 5 0.708370 b_year 1 . 9 6 6 e 04 1 . 3 3 7 e 03 0 . 1 4 7 0.883239 h_floor_no_elevator 2.912 e 02 3 . 8 6 3 e 02 0.754 0.452192 h _ f l o o r _ e l e v a t o r 1 . 7 6 0 e 02 4 . 6 5 5 e 03 3 . 7 8 1 0.000223 ∗∗∗ b_elevator 1.193 e 01 9 . 3 2 4 e 02 1.279 0.202735 year_nr 3 . 7 5 3 e+01 4 . 3 1 5 e+01 0 . 8 7 0 0.385853 I ( monthlyfee_h_area ^2) 3.322 e 05 2 . 2 6 0 e 04 0.147 0.883347 I ( year_nr ^2) 9.334 e 03 1 . 0 7 3 e 02 0.870 0.385675 S i g n i f . codes : 0 ∗∗∗ 0 . 0 0 1 ∗∗ 0 . 0 1 ∗ 0 . 0 5 . 0 . 1 1

Residual standard e r r o r : 0.09831 on 153 d e g r e e s o f freedom M u l t i p l e R squared : 0 . 8 3 3 5 , Adjusted R squared : 0.8226 F s t a t i s t i c : 7 6 . 6 on 10 and 153 DF, p value : < 2 . 2 e 16

De viktigaste kovariaterna i den här regressionen var h area och h floor elevator som hade väldigt hög signifikans.

VIF v a l u e s 9.356043 e+00 h_area 1.332918 e+02 monthlyfee_h_area 8.755686 e+00 h_rooms 1.095282 e+00 b_year 5.809946 e+00 h_floor_no_elevator 1.268607 e+00 h _ f l o o r _ e l e v a t o r 6.027183 e+00 b_elevator 2.420047 e+07 year_nr 1.347126 e+02 monthlyfee_h_area^2 2.420116 e+07 year_nr^2

Eftersom h area och h rooms har tämligen höga VIF-värden kan det antas att de är korrelerade en aning, det hade gått att transformera des-sa variabler, exempelvis genom att kalla en variabel h area rooms dvs. kvadratmeter per rum.

Men eftersom det inte var något väldigt stort värde, som VIF-värdena antog samt att grundekvationen ekvation (3.1) inte skulle avvika mellan de olika områdena bedömdes den här transformationen inte vara av betydande art.

Att h floor elevator och h floor no elevator har höga VIF värden beror på att de även lagts till samma kvadrerade variabler i modellem p.g.a. att fel förväntat tecken.

Preds

h_area monthlyfee_h_area h_rooms 55 50.90909 2 b_year h _ f l o o r _ e l e v a t o r h_floor_no_elevator 1949 3 0 b_elevator year_nr 1 2013 > exp ( p r e d i c t (M3, newdata=preds ) )

(26)

1909465

4.1.2 Resultat

Den procentuella ökningen för Filmstaden mellan år 2005-2013 blev således

P rediktion2013 P rediktion2005 = 1909465 1412307 = 1.3520⇡ 35.2% ökning. 4.1.3 Råsunda Råsunda 2005-2007

I modellen för den här regressionen behövdes ingen ytterligare transforma-tion av ekvatransforma-tion (3.1) utföras.

log t price = 0+(h area) 1+(monthlf ee h area) 2+(h rooms) 3+

(h f loor no elevator) 4+(h f loor elevator) 5+(b elevator) 6+(b year) 7+(year nr) 8+✏

(4.3)

S t u d e n t i z e d Breusch Pagan t e s t

BP = 3 2 . 2 0 2 9 , df = 8 , p value = 8 . 5 6 6 e 05

Figur 3.1.5: Normal Q-Q plotten påvisar att residualerna med god approxi-mation följer en normalfördelning.

(27)

Figur 3.1.6: Residualdatan illustrerad, x-axeln motsvarar logaritmerad för-säljningspris.

R e s i d u a l s :

Min 1Q Median 3Q Max 0.48036 0.08793 0.00524 0.10980 0.33063 C o e f f i c i e n t s :

Estimate Std . Error t value Pr( >| t | ) ( I n t e r c e p t ) 3.333 e+02 2 . 7 0 4 e+01 12.327 < 2e 16 ∗∗∗ h_area 7 . 3 9 9 e 03 1 . 6 5 1 e 03 4 . 4 8 2 1 . 2 4 e 05 ∗∗∗ monthlyfee_h_area 4.811 e 03 1 . 2 6 3 e 03 3.809 0.000186 ∗∗∗ h_rooms 1 . 5 0 7 e 01 3 . 3 8 9 e 02 4 . 4 4 7 1 . 4 4 e 05 ∗∗∗ b_year 2.397 e 03 5 . 6 1 0 e 04 4.272 2 . 9 9 e 05 ∗∗∗ h_floor_no_elevator 6.019 e 02 5 . 0 4 6 e 02 1.193 0.234378 h _ f l o o r _ e l e v a t o r 2 . 4 7 6 e 02 8 . 0 5 6 e 03 3 . 0 7 3 0.002413 ∗∗ b_elevator 4.548 e 02 6 . 3 6 7 e 02 0.714 0.475938 year_nr 1 . 7 5 4 e 01 1 . 3 4 8 e 02 13.017 < 2e 16 ∗∗∗ S i g n i f . codes : 0 ∗∗∗ 0 . 0 0 1 ∗∗ 0 . 0 1 ∗ 0 . 0 5 . 0 . 1 1

Residual standard e r r o r : 0.1569 on 200 d e g r e e s o f freedom M u l t i p l e R squared : 0 . 8 7 0 1 , Adjusted R squared : 0 . 8 6 5 F s t a t i s t i c : 2 0 4 . 4 on 8 and 200 DF, p value : < 2 . 2 e 16

Note : H e t e r o s k e d a s t i c i t y c o n s i s t e n t standard e r r o r s u s i n g White adjustment hc0

De viktigaste kovariaterna i den här regressionen var h area, year nr, monthlyf ee h area, h rooms och b year som hade väldigt hög signifi-kans. VIF v a l u e s 7.056080 h_area 1.410149 monthlyfee_h_area 6.515225 h_rooms 1.089565 b_year 31.937586 h_floor_no_elevator 1.159969 h _ f l o o r _ e l e v a t o r 32.280267 b_elevator 1.024951 year_nr

(28)

Ovan ser man att h floor no elevator och b elevator har tämligen höga VIF-värden antas det att de är korrelerade.

Preds

h_area monthlyfee_h_area h_rooms 60 43.33333 2 b_year h _ f l o o r _ e l e v a t o r h_floor_no_elevator 1929 2 0 b_elevator year_nr 1 2005 > exp ( p r e d i c t (M1, newdata=preds ) ) 1536457 Råsunda 2010-2013

I modellen för den här regressionen behövdes ingen ytterligare transforma-tion av ekvatransforma-tion (3.1) utföras.

log t price = 0+(h area) 1+(monthlf ee h area) 2+(h rooms) 3+

(h f loor no elevator 4+ (h f loor elevator) 5+

(b elevator) 6+ (b year) 7+ (year nr) 8+ ✏ (4.4)

S t u d e n t i z e d Breusch Pagan t e s t

BP = 3 2 . 2 0 2 9 , df = 8 , p value = 8 . 5 6 6 e 05

Figur 3.1.7: Normal Q-Q plotten påvisar att residualerna med god approxi-mation följer en normalfördelning.

(29)

Figur 3.1.8: Residualdatan illustrerad, x-axeln motsvarar logaritmerad för-säljningspris.

R e s i d u a l s :

Min 1Q Median 3Q Max 0.62515 0.07043 0.00965 0.07095 0.29547 C o e f f i c i e n t s :

Estimate Std . Error t value Pr( >| t | ) ( I n t e r c e p t ) 5.509 e+01 1 . 4 7 7 e+01 3.729 0.000228 ∗∗∗ h_area 6 . 1 3 1 e 03 1 . 3 0 0 e 03 4 . 7 1 7 3 . 6 3 e 06 ∗∗∗ monthlyfee_h_area 5.044 e 03 8 . 5 2 7 e 04 5.915 8 . 8 1 e 09 ∗∗∗ h_rooms 1 . 7 6 2 e 01 2 . 2 1 7 e 02 7 . 9 4 5 3 . 6 5 e 14 ∗∗∗ b_year 1.685 e 03 5 . 5 6 4 e 04 3.028 0.002665 ∗∗ h_floor_no_elevator 1 . 4 7 4 e 01 4 . 5 5 6 e 02 3 . 2 3 5 0.001348 ∗∗ h _ f l o o r _ e l e v a t o r 2 . 7 2 1 e 02 5 . 2 5 7 e 03 5 . 1 7 6 4 . 0 9 e 07 ∗∗∗ b_elevator 1 . 9 2 2 e 01 6 . 4 7 2 e 02 2 . 9 7 0 0.003209 ∗∗ year_nr 3 . 5 9 2 e 02 7 . 3 0 7 e 03 4 . 9 1 6 1 . 4 4 e 06 ∗∗∗ S i g n i f . codes : 0 ∗∗∗ 0 . 0 0 1 ∗∗ 0 . 0 1 ∗ 0 . 0 5 . 0 . 1 1

Residual standard e r r o r : 0.1162 on 309 d e g r e e s o f freedom M u l t i p l e R squared : 0 . 9 0 6 7 , Adjusted R squared : 0.9043 F s t a t i s t i c : 2 2 3 . 2 on 8 and 309 DF, p value : < 2 . 2 e 16

Note : H e t e r o s k e d a s t i c i t y c o n s i s t e n t standard e r r o r s u s i n g White adjustment hc0

Här har samtliga kovariater en relativt hög signifikas, vilket indikerar på att förklaringsgraden är hög. VIF v a l u e s 7.459467 h_area 1.291435 monthlyfee_h_area 7.046952 h_rooms 1.085042 b_year 9.308666 h_floor_no_elevator 1.089396 h _ f l o o r _ e l e v a t o r 9.314573 b_elevator 1.012657 year_nr

Alla VIF- värden i den här regressionen är under 10 vilket tyder på att multikollinearitetet inte är så skadligt.

(30)

Preds

h_area monthlyfee_h_area h_rooms 60 43.33333 2 b_year h _ f l o o r _ e l e v a t o r h_floor_no_elevator 1929 2 0 b_elevator year_nr 1 2013 > exp ( p r e d i c t (M1, newdata=preds ) ) 2466001 4.1.4 Resultat

Den procentuella ökningen för Råsunda mellan år 2005-2013 blev således

P rediktion2013

P rediktion2005 =

2466001

1536457 = 1.60499⇡ 60.5% ökning.

4.2 Kungsholmen

I närområdet kring Lindhagensterrassen på Kungsholmen som byggdes mel-lan åren 2005-2010, har områdena Thorildspmel-lan och Stadshagen agerat som närområde medan Kungsholmen innanför tullarna verkat som indexerande område.

I närområdet har den procentuella prisökningen mellan åren 2005-2013 varit 73,8% medan i det indexerande området skett en 61 procentig prisökning under samma period. Det finns sådeles en stor chans att påvisa en positiv prisutveckling tack vare nybyggnadsprojektet Lindhagensterrassen.

Det är dock viktigt att prisutvecklingen kan bero på andra faktorer än just att ett nybyggnadsprojekt har byggts, det kan även vara så att innerstan växer utåt och områden precis utanför tullarna närmar sig en prisnivå som objekt innanför tullarna. Det här eftersom Stockholms popularitet ökar med årlig basis och efterfrågan är större än tillgången på centralt belägna bo-stadsobjekt.

4.2.1 Lindhagen

Lindhagen 2005-2007

Variabeln h floor no elevator visade fel förväntat tecken efter att en regres-sion med grundekvationen, ekvationen (3.1) utförts. Ekvationen med

(31)

trans-formerade variabler blev därmed på följande form:

log t price = 0+(h area) 1+(monthlyf ee h area) 2+(h rooms) 3+

(h f loor no elevator) 4+ (h f loor elevator) 5+

(b elevator 6(b year) 7+ (year nr) 8+ (h f loor no elevator)2 9+ ✏

(4.5) R-data

S t u d e n t i z e d Breusch Pagan t e s t

BP = 2 3 . 1 4 5 6 , df = 9 , p value = 0.005877

Figur 3.2.1: Normal Q-Q plotten påvisar att residualerna med god approxi-mation följer en normalfördelning.

Figur 3.2.2: Residualdatan illustrerad, x-axeln motsvarar logaritmerad för-säljningspris.

R e s i d u a l s :

Min 1Q Median 3Q Max 0.84224 0.07750 0.00209 0.07660 0.61541

(32)

C o e f f i c i e n t s :

Estimate Std . Error t value Pr( >| t | ) ( I n t e r c e p t ) 3.643 e+02 2 . 1 2 5 e+01 17.147 < 2e 16 ∗∗∗ h_area 1 . 4 6 9 e 02 1 . 0 8 4 e 03 13.552 < 2e 16 ∗∗∗ monthlyfee_h_area 7.710 e 03 7 . 9 6 0 e 04 9.686 < 2e 16 ∗∗∗ h_rooms 1 . 7 2 4 e 02 2 . 1 1 7 e 02 0 . 8 1 4 0.416090 b_year 2.645 e 03 6 . 5 0 3 e 04 4.067 5 . 8 2 e 05 ∗∗∗ h _ f l o o r _ e l e v a t o r 2 . 0 9 2 e 02 6 . 2 4 4 e 03 3 . 3 5 0 0.000891 ∗∗∗ h_floor_no_elevator 5 . 2 6 5 e 02 2 . 1 4 2 e 02 2 . 4 5 8 0.014414 ∗ b_elevator 5 . 2 6 8 e 02 3 . 8 9 0 e 02 1 . 3 5 4 0.176472 year_nr 1 . 9 1 1 e 01 1 . 0 5 5 e 02 18.110 < 2e 16 ∗∗∗ I ( h_floor_no_elevator ^2) 9.147 e 03 3 . 0 4 0 e 03 3.009 0.002804 ∗∗ S i g n i f . codes : 0 ∗∗∗ 0 . 0 0 1 ∗∗ 0 . 0 1 ∗ 0 . 0 5 . 0 . 1 1

Residual standard e r r o r : 0.1491 on 367 d e g r e e s o f freedom M u l t i p l e R squared : 0 . 8 7 7 , Adjusted R squared : 0 . 8 7 4 F s t a t i s t i c : 2 7 2 . 5 on 9 and 367 DF, p value : < 2 . 2 e 16

Note : H e t e r o s k e d a s t i c i t y c o n s i s t e n t standard e r r o r s u s i n g White adjustment hc0

De viktigaste kovariaterna i den här regressionen var h area, year nr, monthlyf ee h area , h floor elevator och b year som hade högst sig-nifikans. VIF v a l u e s 6.299071 h_area 2.213485 monthlyfee_h_area 5.252839 h_rooms 1.695155 b_year 33.294897 h_floor_no_elevator 3.191995 h _ f l o o r _ e l e v a t o r 9.946601 b_elevator 1.039617 year_nr 15.153055 h_floor_no_elevator ^2

Att h floor no elevator och (h floor no elevator)2 har höga VIF

vär-den beror på att beror på att man valt att kvadrera termen på grund av fel förväntat tecken för h floor no elevator.

Preds

h_area monthlyfee_h_area h_rooms

48 54 2 b_year h _ f l o o r _ e l e v a t o r h_floor_no_elevator 1942 3 0 b_elevator year_nr 1 2005 > exp ( p r e d i c t (m2, newdata=preds ) ) 1395090 .

(33)

Lindhagen 2010-2013

Variabeln h floor no elevator visade fel förväntat tecken efter att en regres-sion med grundekvationen ekv (3.1) utförts. Ekvationen med transformerade variabler blev därmed på följande form:

log t price = 0+(h area) 1+(monthlyf ee h area) 2+(h rooms) 3+

(h f loor no elevator) 4+ (h f loor elevator) 5+

(b elevator) 6+(b year) 7+(year nr) 8+(h f loor no elevator)2 9+✏

(4.6) R-data

S t u d e n t i z e d Breusch Pagan t e s t

BP = 2 8 . 2 9 4 9 , df = 9 , p value = 0.0008514

Figur 3.2.3: Normal Q-Q plotten påvisar att residualerna med god approxi-mation följer en normalfördelning.

(34)

Figur 3.2.4: Residualdatan illustrerad, x-axeln motsvarar logaritmerad för-säljningspris.

R e s i d u a l s :

Min 1Q Median 3Q Max 0.33962 0.06122 0.00452 0.05692 0.53682 C o e f f i c i e n t s :

Estimate Std . Error t value Pr( >| t | ) ( I n t e r c e p t ) 4.816 e+01 9 . 3 6 8 e+00 5.141 3 . 9 9 e 07 ∗∗∗ h_area 1 . 5 2 5 e 02 5 . 9 4 2 e 04 25.669 < 2e 16 ∗∗∗ monthlyfee_h_area 1.378 e 03 6 . 6 0 9 e 04 2.085 0.0376 ∗ h_rooms 1 . 3 1 3 e 02 1 . 2 2 3 e 02 1 . 0 7 4 0.2835 b_year 2.053 e 03 3 . 5 6 0 e 04 5.767 1 . 4 5 e 08 ∗∗∗ h _ f l o o r _ e l e v a t o r 9 . 7 2 8 e 03 3 . 3 5 4 e 03 2 . 9 0 0 0.0039 ∗∗ h_floor_no_elevator 3 . 2 2 9 e 02 2 . 8 5 8 e 02 1 . 1 3 0 0.2592 b_elevator 2 . 7 5 5 e 02 3 . 5 9 0 e 02 0 . 7 6 7 0.4432 year_nr 3 . 2 8 4 e 02 4 . 6 5 7 e 03 7 . 0 5 2 6 . 2 2 e 12 ∗∗∗ I ( h_floor_no_elevator ^2) 6.336 e 03 5 . 5 1 2 e 03 1.149 0.2510 S i g n i f . codes : 0 ∗∗∗ 0 . 0 0 1 ∗∗ 0 . 0 1 ∗ 0 . 0 5 . 0 . 1 1

Residual standard e r r o r : 0.0995 on 477 d e g r e e s o f freedom M u l t i p l e R squared : 0 . 9 0 9 4 , Adjusted R squared : 0.9076 F s t a t i s t i c : 3 4 6 . 9 on 9 and 477 DF, p value : < 2 . 2 e 16

Note : H e t e r o s k e d a s t i c i t y c o n s i s t e n t standard e r r o r s u s i n g White adjustment hc0

De viktigaste kovariaterna i den här regressionen var h area, year nr, b year , monthlyfee h area,h floor elevator och b year som har väl-digt hög signifikans. VIF v a l u e s 5.767597 h_area 1.521171 monthlyfee_h_area 5.421467 h_rooms 1.914372 b_year 92.463027 h_floor_no_elevator 2.640476 h _ f l o o r _ e l e v a t o r 9.946601 b_elevator 1.024555 year_nr 45.490780 h_floor_no_elevator ^2

Här har h floor no elevator och (h floor no elevator)2 höga VIF

vär-den, det beror på att de även lagts till kvadrerade term i modellen pga. fel förväntat tecken.

Preds

h_area monthlyfee_h_area h_rooms

48 54 2 b_year h _ f l o o r _ e l e v a t o r h_floor_no_elevator 1942 3 0 b_elevator year_nr 1 2013 > exp ( p r e d i c t (m2, newdata=preds ) ) 2424826

(35)

4.2.2 Resultat

Den procentuella ökningen för Lindhagen mellan år 2005-2013 blev således

P rediktion2013

P rediktion2005 =

2424826

1395090 = 1.73811⇡ 73.8% ökning.

4.2.3 Kungsholmen innanför tullarna

Kungsholmen 2005-2007

Variabeln h floor no elevator visade fel förväntat tecken efter att en regres-sion med grundekvationen ekv (3.1) utförts. Ekvationen med transformerade variabler blev därmed på följande form:

log t price = 0+(h area) 1+(monthlyf ee h area) 2+(h rooms) 3+

(h f loor no elevator) 4+ (h f loor elevator) 5+

(b elevator) 6+(b year) 7+(year nr) 8+(h f loor no elevator)2 9+✏

(4.7) R-data

S t u d e n t i z e d Breusch Pagan t e s t

BP = 3 4 2 . 5 2 6 9 , df = 9 , p value < 2 . 2 e 16

Figur 3.2.5: Normal Q-Q plotten påvisar att residualerna med god approxi-mation följer en normalfördelning.

(36)

Figur 3.2.6: Residualdatan illustrerad, x-axeln motsvarar logaritmerad för-säljningspris.

R e s i d u a l s :

Min 1Q Median 3Q Max 1.04926 0.09948 0.00319 0.10241 0.70283 C o e f f i c i e n t s :

Estimate Std . Error t value Pr( >| t | ) ( I n t e r c e p t ) 3.010 e+02 8 . 6 1 7 e+00 34.928 < 2e 16 ∗∗∗ h_area 1 . 0 6 9 e 02 3 . 9 7 6 e 04 26.879 < 2e 16 ∗∗∗ monthlyfee_h_area 3.792 e 03 2 . 8 8 1 e 04 13.165 < 2e 16 ∗∗∗ h_rooms 8 . 3 4 1 e 02 8 . 6 6 5 e 03 9 . 6 2 6 < 2e 16 ∗∗∗ b_year 7.981 e 04 1 . 4 1 2 e 04 5.654 1 . 7 2 e 08 ∗∗∗ h _ f l o o r _ e l e v a t o r 2 . 4 7 4 e 02 2 . 3 7 0 e 03 10.441 < 2e 16 ∗∗∗ h_floor_no_elevator 6.179 e 02 2 . 8 6 0 e 02 2.161 0.0308 ∗ b_elevator 9.449 e 02 3 . 7 9 7 e 02 2.488 0.0129 ∗ year_nr 1 . 5 7 8 e 01 4 . 2 9 3 e 03 36.759 < 2e 16 ∗∗∗ I ( h_floor_no_elevator ^2) 1 . 4 5 1 e 02 5 . 0 1 0 e 03 2 . 8 9 6 0.0038 ∗∗ S i g n i f . codes : 0 ∗∗∗ 0 . 0 0 1 ∗∗ 0 . 0 1 ∗ 0 . 0 5 . 0 . 1 1

Residual standard e r r o r : 0.1687 on 2851 d e g r e e s o f freedom M u l t i p l e R squared : 0 . 8 6 4 , Adjusted R squared : 0.8636 F s t a t i s t i c : 8 8 2 . 9 on 9 and 2851 DF, p value : < 2 . 2 e 16

Note : H e t e r o s k e d a s t i c i t y c o n s i s t e n t standard e r r o r s u s i n g White adjustment hc0

Här har samtliga kovariater en relativt hög signifikas, vilket indikerar på att förklaringsgraden är hög. VIF v a l u e s 5.011186 h_area 1.152106 monthlyfee_h_area 4.916087 h_rooms 1.145418 b_year 78.907366 h_floor_no_elevator 1.545307 h _ f l o o r _ e l e v a t o r 22.305147 b_elevator 1.006241 year_nr 28.379571 h_floor_no_elevator ^2

h f loor no elevator och (h floor no elevator)2 har höga VIF värden beror på att beror på att man valt att kvadrera termen på grund av fel

(37)

förväntat tecken för h floor no elevator.

Preds

h_area monthlyfee_h_area h_rooms

59 46 2 b_year h _ f l o o r _ e l e v a t o r h_floor_no_elevator 1929 3 0 b_elevator year_nr 1 2005 > exp ( p r e d i c t (m2, newdata=preds ) ) 2033603 Kungsholmen 2010-2013

Variabeln h floor no elevator visade fel förväntat tecken efter att en regres-sion med grundekvationen ekv (3.1) utförts. Ekvationen med transformerade variabler blev därmed på följande form:

log t price = 0+(h area) 1+(monthlyf ee h area) 2+(h rooms) 3+

(h f loor no elevator) 4+ (h f loor elevator) 5+

(b elevator) 6+(b year) 7+(year nr) 8+(h f loor no elevator)2 9+✏

(4.8) R-data

S t u d e n t i z e d Breusch Pagan t e s t

BP = 9 4 . 7 4 7 9 , df = 9 , p value < 2 . 2 e 16

Figur 3.2.7: Normal Q-Q plotten påvisar att residualerna med god approxi-mation följer en normalfördelning.

(38)

FIgur 3.2.8: Residualdatan illustrerad, x-axeln motsvarar logaritmerad för-säljningspris.

R e s i d u a l s :

Min 1Q Median 3Q Max 2.28976 0.07673 0.00422 0.08535 0.63426 C o e f f i c i e n t s :

Estimate Std . Error t value Pr( >| t | ) ( I n t e r c e p t ) 5.261 e+01 5 . 0 4 6 e+00 10.426 <2e 16 ∗∗∗ h_area 1 . 0 8 6 e 02 3 . 7 1 3 e 04 29.238 <2e 16 ∗∗∗ monthlyfee_h_area 2.516 e 03 1 . 9 6 9 e 04 12.779 <2e 16 ∗∗∗ h_rooms 8 . 2 2 0 e 02 9 . 2 1 6 e 03 8 . 9 1 9 <2e 16 ∗∗∗ b_year 1.280 e 03 1 . 0 8 6 e 04 11.788 <2e 16 ∗∗∗ h _ f l o o r _ e l e v a t o r 1 . 8 4 5 e 02 1 . 7 5 2 e 03 10.525 <2e 16 ∗∗∗ h_floor_no_elevator 4 . 9 9 9 e 02 3 . 2 8 2 e 02 1 . 5 2 3 0.1278 b_elevator 7 . 1 0 7 e 02 3 . 9 8 1 e 02 1 . 7 8 5 0.0743 . year_nr 3 . 4 4 1 e 02 2 . 5 0 6 e 03 13.734 <2e 16 ∗∗∗ I ( h_floor_no_elevator ^2) 4.767 e 03 6 . 1 2 3 e 03 0.779 0.4363 S i g n i f . codes : 0 ∗∗∗ 0 . 0 0 1 ∗∗ 0 . 0 1 ∗ 0 . 0 5 . 0 . 1 1

Residual standard e r r o r : 0 . 1 4 8 on 3735 d e g r e e s o f freedom M u l t i p l e R squared : 0 . 8 7 8 7 , Adjusted R squared : 0.8784 F s t a t i s t i c : 1148 on 9 and 3735 DF, p value : < 2 . 2 e 16

Note : H e t e r o s k e d a s t i c i t y c o n s i s t e n t standard e r r o r s u s i n g White adjustment hc0

De viktigaste kovariaterna i den här regressionen är h area, monthlyfee h area, h rooms, b year, year nr och h floor elevator som hade väldigt hög sig-nifikans. VIF v a l u e s 5.358032 h_area 1.173201 monthlyfee_h_area 5.177722 h_rooms 1.136189 b_year 72.306854 h_floor_no_elevator 1.466991 h _ f l o o r _ e l e v a t o r 20.277095 b_elevator 1.010713 year_nr

(39)

26.238655 h_floor_no_elevator ^2

Här har h floor no elevator och (h floor no elevator)2 höga VIF

vär-den, det beror på att man valt att kvadrera termen på grund av fel förväntat tecken för h floor no elevator, även b elevatorhar hög VIF-värde.

Preds

h_area monthlyfee_h_area h_rooms

59 46 2 b_year h _ f l o o r _ e l e v a t o r h_floor_no_elevator 1929 3 0 b_elevator year_nr 1 2013 > exp ( p r e d i c t (m2, newdata=preds ) ) 3275556 4.2.4 Resultat

Den procentuella ökningen för Kungsholmen innanför tullarna mellan år 2005-2013 blev således P rediktion2013

P rediktion2005 =

3275556

2033603 = 1.61071⇡ 61.1% ökning.

4.3 Hägersten

Området kring Telefonplan är väldigt expansivt och flertalet nybyggnads-projekt har påbörjats de senaste åren, ett av de största, Kv. Tvålflingan blev färdigställt år 2009 så analysen kretsar kring denna. Som indexerande område har Midsommarkransen/Aspudden verkat under den här analysen. Prisutvecklingen mellan åren 2005-2013 har varit 83,9% i området kring Tele-fonplan, medan prisutvecklingen i Midsommarkransen/Aspudden har under samma tidsperiod varit 46,7%. Här finns en tydlig indikation på att nybygg-nadsprojekten har haft en väldigt positiv inverkan på prisbilden.

4.3.1 Telefonplan

Telefonplan 2005-2007

Variabeln h floor no elevator visade fel förväntat tecken efter att en regres-sion med grundekvationen ekv (3.1) utförts. Ekvationen med transformerade variabler blev därmed på följande form:

log t price = 0+ (h area) 1+ (monthlyf ee h area) 2+

(h rooms) 3+ (b year) 4+ (h f loor no elevator) 5+

(year nr) 6+ (h f loor no elevator)2 7+ ✏ (4.9)

(40)

S t u d e n t i z e d Breusch Pagan t e s t

BP = 2 3 . 0 3 1 9 , df = 7 , p value = 0.001683

Figur 3.3.1: Normal Q-Q plotten påvisar att residualerna med god approxi-mation följer en normalfördelning.

Figur 3.3.2: Residualdatan illustrerad, x-axeln motsvarar logaritmerad för-säljningspris.

R e s i d u a l s :

Min 1Q Median 3Q Max 0.45750 0.07486 0.00540 0.07419 0.25557 C o e f f i c i e n t s :

Estimate Std . Error t value Pr( >| t | ) ( I n t e r c e p t ) 3.643 e+02 1 . 8 3 4 e+01 19.865 < 2e 16 ∗∗∗ h_area 1 . 2 2 3 e 02 2 . 3 7 6 e 03 5 . 1 5 0 6 . 4 8 e 07 ∗∗∗ monthlyfee_h_area 1.992 e 03 2 . 4 4 7 e 03 0.814 0.4168 h_rooms 4 . 2 7 9 e 02 3 . 4 7 2 e 02 1 . 2 3 2 0.2193 b_year 1.458 e 03 2 . 8 8 6 e 03 0.505 0.6141 h_floor_no_elevator 1 . 2 5 8 e 01 6 . 2 2 3 e 02 2 . 0 2 2 0.0446 ∗ year_nr 1 . 8 9 7 e 01 8 . 5 2 4 e 03 22.257 < 2e 16 ∗∗∗ I ( h_floor_no_elevator ^2) 2.686 e 02 1 . 5 6 5 e 02 1.716 0.0877 . S i g n i f . codes : 0 ∗∗∗ 0 . 0 0 1 ∗∗ 0 . 0 1 ∗ 0 . 0 5 . 0 . 1 1

(41)

Residual standard e r r o r : 0.1096 on 190 d e g r e e s o f freedom M u l t i p l e R squared : 0 . 8 3 9 4 , Adjusted R squared : 0.8335 F s t a t i s t i c : 182 on 7 and 190 DF, p value : < 2 . 2 e 16

Note : H e t e r o s k e d a s t i c i t y c o n s i s t e n t standard e r r o r s u s i n g White adjustment hc0

I den här regressionen har h area och year nr en hög signifikans.

VIF v a l u e s 6.557846 h_area 2.288254 monthlyfee_h_area 4.942730 h_rooms 2.060182 b_year 31.093554 h_floor_no_elevator 1.067864 year_nr 31.015038 h_floor_no_elevator ^2

Ovan ser man att h floor no elevator och (h floor no elevator)2 har

höga VIF-värden och det antas att de är korrelerade.

Preds

h_area monthlyfee_h_area h_rooms

50 52 2

b_year h_floor_no_elevator year_nr 1935 2 2005 > exp ( p r e d i c t (M2, newdata=preds ) )

1180726

Telefonplan 2010-2013

Variabeln h floor no elevator visade fel förväntat tecken efter att en regres-sion med grundekvationen ekv (3.1) utförts. Ekvationen med transformerade variabler blev därmed på följande form:

log t price = 0+(h area) 1+(monthlyf ee h area) 2+(h rooms) 3+

(h f loor no elevator) 4+ (h f loor elevator) 5+

(b elevator) 6+(b year) 7+(year nr) 8+(h f loor no elevator)2 9+✏

(4.10)

R-data

S t u d e n t i z e d Breusch Pagan t e s t

(42)

Figur 3.3.3: Normal Q-Q plotten påvisar att residualerna med god approxi-mation följer en normalfördelning.

Figur 3.3.4: Residualdatan illustrerad, x-axeln motsvarar logaritmerad för-säljningspris.

R e s i d u a l s :

Min 1Q Median 3Q Max 0.98791 0.06652 0.00250 0.06835 0.37283 C o e f f i c i e n t s :

Estimate Std . Error t value Pr( >| t | ) ( I n t e r c e p t ) 7.047 e+01 1 . 5 1 6 e+01 4.650 4 . 7 4 e 06 ∗∗∗ h_area 8 . 8 8 7 e 03 1 . 6 7 2 e 03 5 . 3 1 6 1 . 9 1 e 07 ∗∗∗ monthlyfee_h_area 8.700 e 03 1 . 2 7 6 e 03 6.819 4 . 1 6 e 11 ∗∗∗ h_rooms 7 . 1 2 2 e 02 2 . 6 6 6 e 02 2 . 6 7 1 0.00792 ∗∗ b_year 1.509 e 03 9 . 4 6 1 e 04 1.595 0.11171 h_floor_no_elevator 5 . 6 9 1 e 02 4 . 5 8 0 e 02 1 . 2 4 3 0.21485 h _ f l o o r _ e l e v a t o r 3 . 4 6 1 e 02 1 . 6 3 9 e 02 2 . 1 1 2 0.03540 ∗ b_elevator 3 . 5 9 0 e 02 6 . 1 4 2 e 02 0 . 5 8 5 0.55922 year_nr 4 . 3 5 9 e 02 7 . 6 5 0 e 03 5 . 6 9 8 2 . 6 2 e 08 ∗∗∗ I ( h_floor_no_elevator ^2) 9.561 e 03 1 . 0 9 0 e 02 0.877 0.38124 S i g n i f . codes : 0 ∗∗∗ 0 . 0 0 1 ∗∗ 0 . 0 1 ∗ 0 . 0 5 . 0 . 1 1

(43)

M u l t i p l e R squared : 0 . 8 2 4 2 , Adjusted R squared : 0.8196 F s t a t i s t i c : 1 9 4 . 2 on 9 and 343 DF, p value : < 2 . 2 e 16

Note : H e t e r o s k e d a s t i c i t y c o n s i s t e n t standard e r r o r s u s i n g White adjustment hc0

De viktigaste kovariaterna i den här regressionen är h area, year nr, monthlyfee h area, h roomsoch h floor elevator som har väldigt hög signifikans.

VIF v a l u e s 9.284599 h_area 1.505154 monthlyfee_h_area 6.515763 h_rooms 3.279697 b_year 98.856086 h_floor_no_elevator 4.623145 h _ f l o o r _ e l e v a t o r 15.573655 b_elevator 1.041117 year_nr 62.985231 h_floor_no_elevator ^2

Ovan ser man att h floor no elevator och (h floor no elevator)2 har

höga VIF-värden och det antas att de är korrelerade. Även b elevator har VIF-värde över 10.

Preds

h_area monthlyfee_h_area h_rooms

50 52 2 b_year h _ f l o o r _ e l e v a t o r h_floor_no_elevator 1935 2 0 b_elevator year_nr 1 2013 > exp ( p r e d i c t (M2, newdata=preds ) ) 2171149 4.3.2 Resultat

Den procentuella ökningen för Telefonplan mellan år 2005-2013 blev således

P rediktion2013

P rediktion2005 =

2171149

1180726 = 1.8388⇡ 83.9% ökning.

4.3.3 Midsommarkransen och Aspudden

Midsommarkrans/Aspudden 2005-2007

Variabeln h floor no elevator visade fel förväntat tecken efter att en regres-sion med grundekvationen ekv (3.1) utförts. Ekvationen med transformerade

(44)

variabler blev därmed på följande form:

log t price = 0+(h area) 1+(monthlyf ee h area) 2+(h rooms) 3+

(h f loor no elevator) 4+ (h f loor elevator) 5+

(b elevator) 6+(b year) 7+(year nr) 8+(h f loor no elevator)2 9+✏

(4.11)

S t u d e n t i z e d Breusch Pagan t e s t

BP = 2 0 . 9 9 2 4 , df = 9 , p value = 0.01268

FIgur 3.3.5: Normal Q-Q plotten påvisar att residualerna med god approxi-mation följer en normalfördelning.

Figur 3.3.6: Residualdatan illustrerad, x-axeln motsvarar logaritmerad för-säljningspris.

R e s i d u a l s :

Min 1Q Median 3Q Max 0.34108 0.09673 0.00010 0.08054 0.36667

(45)

C o e f f i c i e n t s :

Estimate Std . Error t value Pr( >| t | ) ( I n t e r c e p t ) 4.711 e+02 3 . 5 8 4 e+01 13.146 < 2e 16 ∗∗∗ h_area 1 . 0 7 0 e 02 1 . 5 0 2 e 03 7 . 1 2 1 2 . 3 2 e 10 ∗∗∗ monthlyfee_h_area 7.651 e 03 1 . 1 5 6 e 03 6.620 2 . 3 5 e 09 ∗∗∗ h_rooms 1 . 0 0 9 e 01 3 . 2 5 6 e 02 3 . 1 0 0 0.002570 ∗∗ b_year 4.142 e 03 9 . 4 0 5 e 04 4.404 2 . 8 6 e 05 ∗∗∗ h_floor_no_elevator 4 . 5 7 4 e 01 1 . 3 4 5 e 01 3 . 4 0 0 0.000997 ∗∗∗ h _ f l o o r _ e l e v a t o r 3 . 4 0 1 e 01 9 . 7 3 3 e 02 3 . 4 9 4 0.000733 ∗∗∗ b_elevator 1 . 9 1 4 e 02 4 . 4 8 3 e 02 0 . 4 2 7 0.670342 year_nr 2 . 4 5 5 e 01 1 . 8 0 5 e 02 13.605 < 2e 16 ∗∗∗ I ( h_floor_no_elevator ^2) 3 . 0 1 8 e 03 1 . 1 3 4 e 03 2 . 6 6 1 0.009198 ∗∗ S i g n i f . codes : 0 ∗∗∗ 0 . 0 0 1 ∗∗ 0 . 0 1 ∗ 0 . 0 5 . 0 . 1 1

Residual standard e r r o r : 0.1365 on 92 d e g r e e s o f freedom M u l t i p l e R squared : 0 . 9 0 2 2 , Adjusted R squared : 0.8926 F s t a t i s t i c : 1 3 1 . 2 on 9 and 92 DF, p value : < 2 . 2 e 16

Note : H e t e r o s k e d a s t i c i t y c o n s i s t e n t standard e r r o r s u s i n g White adjustment hc0

Här har nästan samtliga kovariater en relativ hög signifikas, vilket indikerar på att förklaringsgraden är hög. VIF v a l u e s 5.699208 h_area 1.331705 monthlyfee_h_area 5.236059 h_rooms 1.306221 b_year 584.785880 h_floor_no_elevator 472.906355 h _ f l o o r _ e l e v a t o r 1.058292 b_elevator 1.140281 year_nr 12.190242 h_floor_no_elevator ^2

Väldigt höga VIF värden på h floor elevator och h floor no elevator.

Preds

h_area monthlyfee_h_area h_rooms

50 52 2 b_year h _ f l o o r _ e l e v a t o r h_floor_no_elevator 1935 2 0 b_elevator year_nr 1 2005 > exp ( p r e d i c t (M4, newdata=preds ) ) 1554490 Midsommar/Aspudden 2010-2013

Variabeln h floor no elevator visade fel förväntat tecken efter att en regres-sion med grundekvationen ekv (3.1) utförts. Ekvationen med transformerade

(46)

variabler blev därmed på följande form:

log t price = 0+(h area) 1+(monthlyf ee h area) 2+(h rooms) 3+

(h f loor no elevator) 4+ (h f loor elevator) 5+

(b elevator) 6+(b year) 7+(year nr) 8+(h f loor no elevator)2 9+✏

(4.12) R-data

S t u d e n t i z e d Breusch Pagan t e s t

BP = 2 3 . 4 8 8 5 , df = 9 , p value = 0.005188

Figur 3.3.7: Normal Q-Q plotten påvisar att residualerna med god approxi-mation följer en normalfördelning.

Figur 3.3.8: Residualdatan illustrerad, x-axeln motsvarar logaritmerad för-säljningspris.

R e s i d u a l s :

(47)

0.32634 0.06074 0.00388 0.05788 0.29408 C o e f f i c i e n t s :

Estimate Std . Error t value Pr( >| t | ) ( I n t e r c e p t ) 8.363 e+01 1 . 7 9 3 e+01 4.665 7 . 2 9 e 06 ∗∗∗ h_area 1 . 0 1 3 e 02 8 . 5 5 7 e 04 11.840 < 2e 16 ∗∗∗ monthlyfee_h_area 2.297 e 03 7 . 0 0 0 e 04 3.281 0.00131 ∗∗ h_rooms 9 . 8 2 8 e 02 1 . 9 8 4 e 02 4 . 9 5 4 2 . 1 2 e 06 ∗∗∗ b_year 3.308 e 03 6 . 8 0 2 e 04 4.864 3 . 1 4 e 06 ∗∗∗ h_floor_no_elevator 8 . 5 6 3 e 02 4 . 6 9 6 e 02 1 . 8 2 4 0.07041 . h _ f l o o r _ e l e v a t o r 5 . 1 2 8 e 02 2 . 8 8 2 e 02 1 . 7 7 9 0.07743 . b_elevator 1 . 5 6 5 e 02 7 . 4 2 7 e 02 0 . 2 1 1 0.83342 year_nr 5 . 1 6 5 e 02 8 . 9 5 8 e 03 5 . 7 6 6 5 . 2 2 e 08 ∗∗∗ I ( h_floor_no_elevator ^2) 1.601 e 02 1 . 0 5 4 e 02 1.519 0.13098 S i g n i f . codes : 0 ∗∗∗ 0 . 0 0 1 ∗∗ 0 . 0 1 ∗ 0 . 0 5 . 0 . 1 1

Residual standard e r r o r : 0.1046 on 136 d e g r e e s o f freedom M u l t i p l e R squared : 0 . 9 0 3 2 , Adjusted R squared : 0.8968 F s t a t i s t i c : 1 0 6 . 6 on 9 and 136 DF, p value : < 2 . 2 e 16

Note : H e t e r o s k e d a s t i c i t y c o n s i s t e n t standard e r r o r s u s i n g White adjustment hc0

Här har nästan samtliga kovariater en relativ hög signifikas, vilket indikerar på att förklaringsgraden är hög. VIF v a l u e s 4.852772 h_area 1.265321 monthlyfee_h_area 4.491775 h_rooms 1.107631 b_year 48.185629 h_floor_no_elevator 7.999702 h _ f l o o r _ e l e v a t o r 13.459659 b_elevator 1.139868 year_nr 30.886152 h_floor_no_elevator ^2

Ovan ser man att h floor no elevator och (h floor no elevator)2 har

höga VIF-värden och det antas att de är korrelerade. Även b elevator har VIF-värde över 10.

Preds

h_area monthlyfee_h_area h_rooms

50 52 2 b_year h _ f l o o r _ e l e v a t o r h_floor_no_elevator 1935 2 0 b_elevator year_nr 1 2013 > exp ( p r e d i c t (M4, newdata=preds ) ) 2276049

(48)

4.3.4 Resultat

Den procentuella ökningen för Midsommarkransen/Aspudden mellan år 2005-2013 blev således P rediktion2013

P rediktion2005 =

2276049

(49)
(50)

Kapitel 5

Diskussion

5.1 Utvecklingsmöjligheter

Studien skall ses som en pilotstudie där det visat sig finnas indikation på positiv prispåverkan på närområdet vid ett nybyggnadsprojekt. Avsaknaden av liknande studier i ämnet gör lösningsmetoden än mer intressant. I två av de tre områden (Lindhagensterrassen och Telefonplan) där undersökningen genomförts har resultatet visat att så varit fallet, i det tredje (Filmstaden i Solna) kunde ingen positiv prispåverkan påvisas.

I Filmstadens fall fanns många bra objekt att analysera men tidsspannet på datan (2005-2013) började troligtvis för sent. För att få högre statistisk signifikans i rapporten och dra fördjupade slutsatser hade fler områden be-hövts undersökas samt att försäljningsdatan hade behövt täcka ett längre tidsspann än år 2005-2013.

Fler städer än Stockholm skulle varit intressant att bearbeta. Metoden som använts i undersökningen kan användas för om intresse finns i en större stu-die som skulle kunna vara rikstäckande. Den viktigaste aspekten har varit att bygga sofistikerade modeller ut efter ”konstens alla regler”.

5.2 Val av programspråk

Det har varit väldigt smidigt att arbeta med modelleringen i R i synnerhet efter att RConsole installerats, en nackdel har dock varit att R har svårt att hantera stora datamängder (filer med mer än 30 000 rader) varvid Excel var till stor hjälp vid selektion av data till de olika områdena som har analyserats. Vi rekommenderar ändå alla som är intresserade av att göra statistiska ana-lyser att testa på R, dels för att det är väldigt användarvänligt och även ”free-ware” vilket implicerar att man alltid kommer ha tillgång till programmet.

(51)

Det är dock viktigt att poängtera att för att utföra olika operationer i pro-grammet behövs olika ”packages” installeras, det här för att ingen onödig datakapacitet skall behövas tas upp i minnet, det kan till en början verka något krångligt men eftersom programmet är så snabbt och effektivt vägs fördelarna lätt upp emot nackdelarna.

(52)

Kapitel 6

Referenser

[1] Chalmers Tekniska Högskolan kurs Matematisk statistik för K (TMA073) den 20/4 2013

http://www.math.chalmers.se/Stat/Grundutb/CTH/tma073/0910/kap11.pdf [2] http://sv.wikipedia.org/wiki/Regressionsanalys den 18/4 2013

[3] Westerlund, Joakim ”Introduktion till ekonometri” LUND, studentlitte-ratur; 2005

[4] http://en.wikipedia.org/wiki/Bias_(statistics) den 22/4 2013

[5] Washington University in St. Louis. Lecturer Mallory Leung den 19/4 http://artsci.wustl.edu/~mleung/Ch12.pdf

[6] Queen’s University, Instructor: Mike Abbott Lecture notes

http://qed.econ.queensu.ca/faculty/abbott/econ452/452note11.pdf [7] Gary King and Margaret Roberts ”How Robust Standard Errors Expose Methodological Problems They Do Not Fix” den 29/4 2013

http://gking.harvard.edu/files/robust.pdf

[8] PIM5-projekt av Maria Törnblom, Örebro 2011-03-23, den 3/5 2013

https://sites.google.com/site/excelibiologiundervisningen/statistisk-analys/ trendlinje-och-r-vaerde

[9] http://en.wikipedia.org/wiki/Variance_inflation_factor den 22/4 2013 [10] Peter Kennedy ”A guide to econometrics” Edition 6, Förlag: Wiley-Blackwell, Utgiven: 200802

(53)

[11] SOLNA STAD den 26/2 2013

http://www.solna.se/sv/stadsbyggnad-trafik/arkitektur-kulturmiljoer/ arkitektur-i-solna/rasunda/ny-bebyggelse-i-filmstaden/

[12] Karin Dahmström ”Från datainsamling till rapport - att göra en sta-tistisk undersökning” upplaga 5, Förlag: Studentlitteratur, Utgiven: 201101, ISBN13: 9789144060279

[13] Harald Lang ” Tropics on Applied Mathematical Statistics” july 2013, version 0.93 [14] Prediktion den 8/5 2013 http://sv.wikipedia.org/wiki/Prediktion [15] Multikollinearitet den 22/4 2013 http://en.wikipedia.org/wiki/Multicollinearity

Programvara

The R Project for Statistical Computing- Version 3.0.1

”R is a free software environment for statistical computing and graphics” http://www.r-project.org

Microsoft Exel- Kalkylbladsprogram från Microsoft Corporation http://office.microsoft.com/sv-se/excel/

(54)

Kapitel 7

Appendix

7.1 R-kod

## 300m f i l m s t a d e n b e f o r e

M2 < lm ( log_t_price~h_area + monthlyfee_h_area + h_rooms + b_year + h_floor_no_elevator + h _ f l o o r _ e l e v a t o r + b_elevator + year_nr + I ( h _ f l o o r _ e l e v a t o r ^2) +I ( h_floor_no_elevator ^2))

summary (M2) b p t e s t (M2) v i f (M2)

preds < data . frame ( h_area =55, monthlyfee_h_area =2800/55 , h_rooms=2, b_year =1949 , h _ f l o o r _ e l e v a t o r =3, h_floor_no_elevator =0, b_elevator =1, year_nr =2005)

cat (" The p r e d i c t e d value o f an apartment i n f i l m s t a d e n year 2005 , with indata preds ") exp ( p r e d i c t (M2, newdata=preds ) )

Koden nedan är med kommandot

## Råsunda b e f o r e , load Rasunda_before . RData b e f o r e u s i n g commands summary (M1)

b p t e s t (M1)

summaryR . lm (M1, type=c (" hc0 " ) ) v i f (M1)

preds < data . frame ( h_area =60, monthlyfee_h_area =2600/60 , h_rooms=2, b_year =1935 , h _ f l o o r _ e l e v a t o r =2, h_floor_no_elevator =0, b_elevator =1, year_nr =2005)

preds

cat (" The p r e d i c t e d value o f an apartment i n Råsunda year 2005 , with indata preds ") exp ( p r e d i c t (M1, newdata=preds ) )

(55)

Author : John Fox

Source : http : / / r . 7 8 9 6 9 5 . n4 . nabble . com/R extend summary lm f o r hccm td815004 . html Adapted by Tony Cookson .

Only Change Made : Changed the name o f the f u n c t i o n ( unwisely maybe )

to summaryR from summaryHCCM. lm . I a l s o changed the s p e l l i n g o f c o n s i s t e n t summaryR . lm < f u n c t i o n ( model , type=c (" hc3 " , " hc0 " , " hc1 " , " hc2 " , " hc4 " ) , . . . ) {

i f ( ! r e q u i r e ( car ) ) stop (" Required car package i s m i s s i n g . " ) type < match . arg ( type )

V < hccm ( model , type=type ) sumry < summary ( model )

t a b l e < c o e f ( sumry ) t a b l e [ , 2 ] < s q r t ( diag (V) ) t a b l e [ , 3 ] < t a b l e [ , 1 ] / t a b l e [ , 2 ]

t a b l e [ , 4 ] < 2∗ pt ( abs ( t a b l e [ , 3 ] ) , df . r e s i d u a l ( model ) , lower . t a i l=FALSE) s u m r y $ c o e f f i c i e n t s < t a b l e

p < nrow ( t a b l e )

hyp < cbind ( 0 , diag ( p 1 ) )

s u m r y $ f s t a t i s t i c [ 1 ] < l i n e a r H y p o t h e s i s ( model , hyp , white . a d j u s t=type ) [ 2 , " F" ] p r i n t ( sumry )

cat (" Note : H e t e r o s k e d a s t i c i t y c o n s i s t e n t standard e r r o r s u s i n g White adjustment " , type , "\n ")

}

7.2 Figurer

(56)

Figur 6.2.2: Området Lindhagen och Kungsholmen innanför tullarna i stads-telsområde Kungsholmen.

Figur 6.2.3: Området Telefonplan och Midsommarkransen/Aspudden i stads-delen Hägersten.

References

Related documents

Senare i uppsatsen kommer bevis för att en minsta lösning existerar och att det utifrån den går att få fram oändligt antal lösningar.. Men låt oss nu nöja oss med att

Vi anser att ett förebyggande arbete mot stress som ska förhindra psykisk ohälsa borde vara strukturerat och tydligt därför skulle det vara av vikt att dels forska

Men enligt Riksan- tikvarieämbetes mening bör detta kunna ske till exempel när det upptäckts kulturhistoriskt värdefulla interiörer som inte tidigare varit kända och som också

– Det blir lättare att följa fältförsöken ur ett bredare perspektiv och det blir bättre kvalitet på rapporten när vi har informationen koncentrerad, säger rapportens

Kvinnorna förblir företagare för att de vill utveckla sina tjänster och produkter och skapa tillväxt medan 17 procent av kvinnorna ansåg att de är nöjda och inte har ambitionen

Om bolagsskatten i det land som den utländska juridiska personen är hemmahörande i, uppgår till 35 procent och därefter till 6/7 tillgodoförs ägaren eller den

Viktigt att hela tiden tänka på detta att en ekvation beskriver en

Antag att bubblan har nått sin terminal hastighet eftersom hastigheten är konstant... Bubblans hastighet är