• No results found

2.1 Regressionsanalys

4.3.3 Midsommarkransen och Aspudden

Midsommarkrans/Aspudden 2005-2007

Variabeln h floor no elevator visade fel förväntat tecken efter att en regres- sion med grundekvationen ekv (3.1) utförts. Ekvationen med transformerade

variabler blev därmed på följande form:

log t price = 0+(h area) 1+(monthlyf ee h area) 2+(h rooms) 3+

(h f loor no elevator) 4+ (h f loor elevator) 5+

(b elevator) 6+(b year) 7+(year nr) 8+(h f loor no elevator)2 9+✏

(4.11)

S t u d e n t i z e d Breusch Pagan t e s t

BP = 2 0 . 9 9 2 4 , df = 9 , p value = 0.01268

FIgur 3.3.5: Normal Q-Q plotten påvisar att residualerna med god approxi- mation följer en normalfördelning.

Figur 3.3.6: Residualdatan illustrerad, x-axeln motsvarar logaritmerad för- säljningspris.

R e s i d u a l s :

Min 1Q Median 3Q Max 0.34108 0.09673 0.00010 0.08054 0.36667

C o e f f i c i e n t s :

Estimate Std . Error t value Pr( >| t | ) ( I n t e r c e p t ) 4.711 e+02 3 . 5 8 4 e+01 13.146 < 2e 16 ∗∗∗ h_area 1 . 0 7 0 e 02 1 . 5 0 2 e 03 7 . 1 2 1 2 . 3 2 e 10 ∗∗∗ monthlyfee_h_area 7.651 e 03 1 . 1 5 6 e 03 6.620 2 . 3 5 e 09 ∗∗∗ h_rooms 1 . 0 0 9 e 01 3 . 2 5 6 e 02 3 . 1 0 0 0.002570 ∗∗ b_year 4.142 e 03 9 . 4 0 5 e 04 4.404 2 . 8 6 e 05 ∗∗∗ h_floor_no_elevator 4 . 5 7 4 e 01 1 . 3 4 5 e 01 3 . 4 0 0 0.000997 ∗∗∗ h _ f l o o r _ e l e v a t o r 3 . 4 0 1 e 01 9 . 7 3 3 e 02 3 . 4 9 4 0.000733 ∗∗∗ b_elevator 1 . 9 1 4 e 02 4 . 4 8 3 e 02 0 . 4 2 7 0.670342 year_nr 2 . 4 5 5 e 01 1 . 8 0 5 e 02 13.605 < 2e 16 ∗∗∗ I ( h_floor_no_elevator ^2) 3 . 0 1 8 e 03 1 . 1 3 4 e 03 2 . 6 6 1 0.009198 ∗∗ S i g n i f . codes : 0 ∗∗∗ 0 . 0 0 1 ∗∗ 0 . 0 1 ∗ 0 . 0 5 . 0 . 1 1

Residual standard e r r o r : 0.1365 on 92 d e g r e e s o f freedom M u l t i p l e R squared : 0 . 9 0 2 2 , Adjusted R squared : 0.8926 F s t a t i s t i c : 1 3 1 . 2 on 9 and 92 DF, p value : < 2 . 2 e 16

Note : H e t e r o s k e d a s t i c i t y c o n s i s t e n t standard e r r o r s u s i n g White adjustment hc0

Här har nästan samtliga kovariater en relativ hög signifikas, vilket indikerar på att förklaringsgraden är hög. VIF v a l u e s 5.699208 h_area 1.331705 monthlyfee_h_area 5.236059 h_rooms 1.306221 b_year 584.785880 h_floor_no_elevator 472.906355 h _ f l o o r _ e l e v a t o r 1.058292 b_elevator 1.140281 year_nr 12.190242 h_floor_no_elevator ^2

Väldigt höga VIF värden på h floor elevator och h floor no elevator.

Preds

h_area monthlyfee_h_area h_rooms

50 52 2 b_year h _ f l o o r _ e l e v a t o r h_floor_no_elevator 1935 2 0 b_elevator year_nr 1 2005 > exp ( p r e d i c t (M4, newdata=preds ) ) 1554490 Midsommar/Aspudden 2010-2013

Variabeln h floor no elevator visade fel förväntat tecken efter att en regres- sion med grundekvationen ekv (3.1) utförts. Ekvationen med transformerade

variabler blev därmed på följande form:

log t price = 0+(h area) 1+(monthlyf ee h area) 2+(h rooms) 3+

(h f loor no elevator) 4+ (h f loor elevator) 5+

(b elevator) 6+(b year) 7+(year nr) 8+(h f loor no elevator)2 9+✏

(4.12) R-data

S t u d e n t i z e d Breusch Pagan t e s t

BP = 2 3 . 4 8 8 5 , df = 9 , p value = 0.005188

Figur 3.3.7: Normal Q-Q plotten påvisar att residualerna med god approxi- mation följer en normalfördelning.

Figur 3.3.8: Residualdatan illustrerad, x-axeln motsvarar logaritmerad för- säljningspris.

R e s i d u a l s :

0.32634 0.06074 0.00388 0.05788 0.29408 C o e f f i c i e n t s :

Estimate Std . Error t value Pr( >| t | ) ( I n t e r c e p t ) 8.363 e+01 1 . 7 9 3 e+01 4.665 7 . 2 9 e 06 ∗∗∗ h_area 1 . 0 1 3 e 02 8 . 5 5 7 e 04 11.840 < 2e 16 ∗∗∗ monthlyfee_h_area 2.297 e 03 7 . 0 0 0 e 04 3.281 0.00131 ∗∗ h_rooms 9 . 8 2 8 e 02 1 . 9 8 4 e 02 4 . 9 5 4 2 . 1 2 e 06 ∗∗∗ b_year 3.308 e 03 6 . 8 0 2 e 04 4.864 3 . 1 4 e 06 ∗∗∗ h_floor_no_elevator 8 . 5 6 3 e 02 4 . 6 9 6 e 02 1 . 8 2 4 0.07041 . h _ f l o o r _ e l e v a t o r 5 . 1 2 8 e 02 2 . 8 8 2 e 02 1 . 7 7 9 0.07743 . b_elevator 1 . 5 6 5 e 02 7 . 4 2 7 e 02 0 . 2 1 1 0.83342 year_nr 5 . 1 6 5 e 02 8 . 9 5 8 e 03 5 . 7 6 6 5 . 2 2 e 08 ∗∗∗ I ( h_floor_no_elevator ^2) 1.601 e 02 1 . 0 5 4 e 02 1.519 0.13098 S i g n i f . codes : 0 ∗∗∗ 0 . 0 0 1 ∗∗ 0 . 0 1 ∗ 0 . 0 5 . 0 . 1 1

Residual standard e r r o r : 0.1046 on 136 d e g r e e s o f freedom M u l t i p l e R squared : 0 . 9 0 3 2 , Adjusted R squared : 0.8968 F s t a t i s t i c : 1 0 6 . 6 on 9 and 136 DF, p value : < 2 . 2 e 16

Note : H e t e r o s k e d a s t i c i t y c o n s i s t e n t standard e r r o r s u s i n g White adjustment hc0

Här har nästan samtliga kovariater en relativ hög signifikas, vilket indikerar på att förklaringsgraden är hög. VIF v a l u e s 4.852772 h_area 1.265321 monthlyfee_h_area 4.491775 h_rooms 1.107631 b_year 48.185629 h_floor_no_elevator 7.999702 h _ f l o o r _ e l e v a t o r 13.459659 b_elevator 1.139868 year_nr 30.886152 h_floor_no_elevator ^2

Ovan ser man att h floor no elevator och (h floor no elevator)2 har

höga VIF-värden och det antas att de är korrelerade. Även b elevator har VIF-värde över 10.

Preds

h_area monthlyfee_h_area h_rooms

50 52 2 b_year h _ f l o o r _ e l e v a t o r h_floor_no_elevator 1935 2 0 b_elevator year_nr 1 2013 > exp ( p r e d i c t (M4, newdata=preds ) ) 2276049

4.3.4 Resultat

Den procentuella ökningen för Midsommarkransen/Aspudden mellan år 2005- 2013 blev således P rediktion2013

P rediktion2005 =

2276049

Kapitel 5

Diskussion

5.1 Utvecklingsmöjligheter

Studien skall ses som en pilotstudie där det visat sig finnas indikation på positiv prispåverkan på närområdet vid ett nybyggnadsprojekt. Avsaknaden av liknande studier i ämnet gör lösningsmetoden än mer intressant. I två av de tre områden (Lindhagensterrassen och Telefonplan) där undersökningen genomförts har resultatet visat att så varit fallet, i det tredje (Filmstaden i Solna) kunde ingen positiv prispåverkan påvisas.

I Filmstadens fall fanns många bra objekt att analysera men tidsspannet på datan (2005-2013) började troligtvis för sent. För att få högre statistisk signifikans i rapporten och dra fördjupade slutsatser hade fler områden be- hövts undersökas samt att försäljningsdatan hade behövt täcka ett längre tidsspann än år 2005-2013.

Fler städer än Stockholm skulle varit intressant att bearbeta. Metoden som använts i undersökningen kan användas för om intresse finns i en större stu- die som skulle kunna vara rikstäckande. Den viktigaste aspekten har varit att bygga sofistikerade modeller ut efter ”konstens alla regler”.

5.2 Val av programspråk

Det har varit väldigt smidigt att arbeta med modelleringen i R i synnerhet efter att RConsole installerats, en nackdel har dock varit att R har svårt att hantera stora datamängder (filer med mer än 30 000 rader) varvid Excel var till stor hjälp vid selektion av data till de olika områdena som har analyserats. Vi rekommenderar ändå alla som är intresserade av att göra statistiska ana- lyser att testa på R, dels för att det är väldigt användarvänligt och även ”free- ware” vilket implicerar att man alltid kommer ha tillgång till programmet.

Det är dock viktigt att poängtera att för att utföra olika operationer i pro- grammet behövs olika ”packages” installeras, det här för att ingen onödig datakapacitet skall behövas tas upp i minnet, det kan till en början verka något krångligt men eftersom programmet är så snabbt och effektivt vägs fördelarna lätt upp emot nackdelarna.

Kapitel 6

Referenser

[1] Chalmers Tekniska Högskolan kurs Matematisk statistik för K (TMA073) den 20/4 2013

http://www.math.chalmers.se/Stat/Grundutb/CTH/tma073/0910/kap11.pdf [2] http://sv.wikipedia.org/wiki/Regressionsanalys den 18/4 2013

[3] Westerlund, Joakim ”Introduktion till ekonometri” LUND, studentlitte- ratur; 2005

[4] http://en.wikipedia.org/wiki/Bias_(statistics) den 22/4 2013

[5] Washington University in St. Louis. Lecturer Mallory Leung den 19/4 http://artsci.wustl.edu/~mleung/Ch12.pdf

[6] Queen’s University, Instructor: Mike Abbott Lecture notes

http://qed.econ.queensu.ca/faculty/abbott/econ452/452note11.pdf [7] Gary King and Margaret Roberts ”How Robust Standard Errors Expose Methodological Problems They Do Not Fix” den 29/4 2013

http://gking.harvard.edu/files/robust.pdf

[8] PIM5-projekt av Maria Törnblom, Örebro 2011-03-23, den 3/5 2013

https://sites.google.com/site/excelibiologiundervisningen/statistisk-analys/ trendlinje-och-r-vaerde

[9] http://en.wikipedia.org/wiki/Variance_inflation_factor den 22/4 2013 [10] Peter Kennedy ”A guide to econometrics” Edition 6, Förlag: Wiley- Blackwell, Utgiven: 200802

[11] SOLNA STAD den 26/2 2013

http://www.solna.se/sv/stadsbyggnad-trafik/arkitektur-kulturmiljoer/ arkitektur-i-solna/rasunda/ny-bebyggelse-i-filmstaden/

[12] Karin Dahmström ”Från datainsamling till rapport - att göra en sta- tistisk undersökning” upplaga 5, Förlag: Studentlitteratur, Utgiven: 201101, ISBN13: 9789144060279

[13] Harald Lang ” Tropics on Applied Mathematical Statistics” july 2013, version 0.93 [14] Prediktion den 8/5 2013 http://sv.wikipedia.org/wiki/Prediktion [15] Multikollinearitet den 22/4 2013 http://en.wikipedia.org/wiki/Multicollinearity

Programvara

The R Project for Statistical Computing- Version 3.0.1

”R is a free software environment for statistical computing and graphics” http://www.r-project.org

Microsoft Exel- Kalkylbladsprogram från Microsoft Corporation http://office.microsoft.com/sv-se/excel/

Kapitel 7

Appendix

7.1 R-kod

## 300m f i l m s t a d e n b e f o r e

M2 < lm ( log_t_price~h_area + monthlyfee_h_area + h_rooms + b_year + h_floor_no_elevator + h _ f l o o r _ e l e v a t o r + b_elevator + year_nr + I ( h _ f l o o r _ e l e v a t o r ^2) +I ( h_floor_no_elevator ^2))

summary (M2) b p t e s t (M2) v i f (M2)

preds < data . frame ( h_area =55, monthlyfee_h_area =2800/55 , h_rooms=2, b_year =1949 , h _ f l o o r _ e l e v a t o r =3, h_floor_no_elevator =0, b_elevator =1, year_nr =2005)

cat (" The p r e d i c t e d value o f an apartment i n f i l m s t a d e n year 2005 , with indata preds ") exp ( p r e d i c t (M2, newdata=preds ) )

Koden nedan är med kommandot

## Råsunda b e f o r e , load Rasunda_before . RData b e f o r e u s i n g commands summary (M1)

b p t e s t (M1)

summaryR . lm (M1, type=c (" hc0 " ) ) v i f (M1)

preds < data . frame ( h_area =60, monthlyfee_h_area =2600/60 , h_rooms=2, b_year =1935 , h _ f l o o r _ e l e v a t o r =2, h_floor_no_elevator =0, b_elevator =1, year_nr =2005)

preds

cat (" The p r e d i c t e d value o f an apartment i n Råsunda year 2005 , with indata preds ") exp ( p r e d i c t (M1, newdata=preds ) )

Author : John Fox

Source : http : / / r . 7 8 9 6 9 5 . n4 . nabble . com/R extend summary lm f o r hccm td815004 . html Adapted by Tony Cookson .

Only Change Made : Changed the name o f the f u n c t i o n ( unwisely maybe )

to summaryR from summaryHCCM. lm . I a l s o changed the s p e l l i n g o f c o n s i s t e n t summaryR . lm < f u n c t i o n ( model , type=c (" hc3 " , " hc0 " , " hc1 " , " hc2 " , " hc4 " ) , . . . ) {

i f ( ! r e q u i r e ( car ) ) stop (" Required car package i s m i s s i n g . " ) type < match . arg ( type )

V < hccm ( model , type=type ) sumry < summary ( model )

t a b l e < c o e f ( sumry ) t a b l e [ , 2 ] < s q r t ( diag (V) ) t a b l e [ , 3 ] < t a b l e [ , 1 ] / t a b l e [ , 2 ]

t a b l e [ , 4 ] < 2∗ pt ( abs ( t a b l e [ , 3 ] ) , df . r e s i d u a l ( model ) , lower . t a i l=FALSE) s u m r y $ c o e f f i c i e n t s < t a b l e

p < nrow ( t a b l e )

hyp < cbind ( 0 , diag ( p 1 ) )

s u m r y $ f s t a t i s t i c [ 1 ] < l i n e a r H y p o t h e s i s ( model , hyp , white . a d j u s t=type ) [ 2 , " F" ] p r i n t ( sumry )

cat (" Note : H e t e r o s k e d a s t i c i t y c o n s i s t e n t standard e r r o r s u s i n g White adjustment " , type , "\n ")

}

7.2 Figurer

Figur 6.2.2: Området Lindhagen och Kungsholmen innanför tullarna i stads- telsområde Kungsholmen.

Figur 6.2.3: Området Telefonplan och Midsommarkransen/Aspudden i stads- delen Hägersten.

Related documents