LINK ¨OPINGS UNIVERSITET Matematiska institutionen Statistik, ANd
Formelsamling
Enkel linj¨ar regressionsananalys:
Modell:
yi=β0+β1· xi+εi
d¨arε∼ N(0,σ).
Anpassad regressionslinje:
ˆ
y = b0+ b1· x d¨ar
b1=∑(xi− ¯x) · (yi− ¯y)
∑(xi− ¯x)2 =∑xi· yi− n · ¯x · ¯y
∑xi2− n · ( ¯x)2 =
=∑xi· yi−(∑xi)·(n∑yi)
∑x2i −(∑nxi)2 =n ·∑xi· yi− (∑xi) · (∑yi) n ·∑x2i − (∑xi)2 b0= ¯y − b1· ¯x
Kvadratsummor:
Total: SST =∑(yi− ¯y)2=∑y2i − n · ( ¯y)2=∑y2i −(∑nyi)2
Residual: SSE =∑(yi− ˆyi)2=∑(yi− ¯y)2− b1·∑(xi− ¯x) · (yi− ¯y) =∑y2i − b0·∑yi− b1·∑xi· yi
Regression: SSR =∑( ˆyi− ¯y)2= SST − SSE F¨orenklingsformler:
Se ovan f¨or∑(yi− ¯y)2och samma kan anv¨andas p˚a∑(xi− ¯x)2
∑(xi− ¯x) · (yi− ¯y) =∑xi· yi− n · ¯x · ¯y =∑xi· yi−(∑xi)·(n∑yi)
Obs!! ∑(xi− ¯x) · (yi− ¯y) 6= n ·∑xi· yi− (∑xi) · (∑yi) Denna variant anv¨ands bara i uttryck f¨or b1och r d˚a motsvarande variant anv¨ands i n¨amnaren!
Variansskattning cσ2= s2= MSE = SSEn − 2 s =√
MSE =q SSE n − 2 F¨orklaringsgrad:
r2= SSRSST
Korrelationskoefficient:
r =
√
r2= ∑(xi− ¯x) · (yi− ¯y)
p∑(xi− ¯x)2·∑(yi− ¯y)2 = ∑xi· yi− n · ¯x · ¯y q
(∑x2i − n · ( ¯x)2) · (∑y2i − n · ( ¯y)2)
=
Konfidensintervall, prognosintervall och hypotespr¨ovning Stickprovsf¨ordelningar:
b1∼ N
β1, σ p∑(xi− ¯x)2
b0∼ N β0,σ·
q1
n+∑(x( ¯x)2
i− ¯x)2
b0+ b1· x0∼ N
β0+β1· x0,σ·q
1
n+∑(x(x0− ¯x)2
i− ¯x)2
Konfidensintervall f¨orβ1: b1± t[α/2](n−2)· s
p∑(xi− ¯x)2 Konfidensintervall f¨orβ0: b0± t[α/2](n−2)· s ·
r
1
n+∑(x( ¯x)2
i− ¯x)2
Konfidensintervall f¨or µy0|x0 =β0+β1· x0: b0+ b1· x0± t[α/2](n−2)· s ·
r
1
n+∑(x(x0− ¯x)2
i− ¯x)2
Prognosintervall f¨or y0=β0+β1· x0+ε0: b0+ b1· x0± t[α/2](n−2)· s ·
r
1 +1n+∑(x(x0− ¯x)2
i− ¯x)2
Formellt t-test av H0:β0= 0:
Testfunktion: t = b0
sb0 = b0
s · r
1
n+∑(x( ¯x)2
i− ¯x)2
J¨amf¨or med ±t[α/2](n−2)
Formellt t-test av H0:β1= 0:
Testfunktion: t = b1
sb1 = b1
√ s
∑(xi− ¯x)2
J¨amf¨or med ±t[α/2](n−2)
Formellt t-test av H0:β1= B (d¨ar B ¨ar n˚agot annat ¨an 0):
Testfunktion: t =b1− B
sb1 = b1− B
√ s
∑(xi− ¯x)2
J¨amf¨or med ±t[α/2](n−2)
Vid enkelsidiga mothypotseser j¨amf¨ors t med t[(n−2)α] (eller med -t[(n−2)α] beroende p˚a mothypotesens riktning).
Formellt F-test av H0:β1= 0:
Testfunktion: F = MSRMSE = SSR/1 SSE/(n − 2) J¨amf¨or med F[α](1,n−2)
Multipel linj¨ar regressionsananalys:
Modell:
yi=β0+β1· xi1+β2· xi2+ . . . +βkxik+εi
d¨arεi∼ N(0,σ).
Anpassad modell:
ˆ
y = b0+ b1· x1+ b2· x2+ . . . bk· xk
Kvadratsummor:
SST=SSE+SSR
Total: SST =∑(yi− ¯y)2=∑y2i − n · ( ¯y)2=∑y2i −(∑nyi)2 Residual: SSE =∑(yi− ˆyi)2
Regression: SSR =∑( ˆyi− ¯y)2= SST − SSE
SSE har n − k − 1 frihetsgrader, SSR har k frihetsgrader.
Variansskattning:
cσ2= s2= MSE = SSE n − k − 1 F¨orklaringsgrad:
R2= SSRSST
Justerad f¨orklaringsgrad:
R2adj= R2= 1 −SSE/(n − k − 1) SST/(n − 1)
Konfidensintervall och hypotespr¨ovning Stickprovsf¨ordelningar:
bj∼ N(βj,σbj)
Formellt F-test av H0:β1=β2= . . . =βk= 0:
Testfunktion: F = MSRMSE= SSR/k SSE/(n − k − 1) J¨amf¨or med F[α](k,n−k−1)
Konfidensintervall f¨orβj: bj± t[α/2](n−k−1)· sbj
d¨ar sbj h¨amtas fr˚an datorutskrift.
Formellt t-test av H0:βj= 0:
Testfuktion: t = bj sbj J¨amf¨or med t[α/2](n−k−1)
Konfidensintervall f¨or µy0|x01,... ,x0k: ˆ
y0± t[α/2](n−k−1)· s√
Distance value d¨ar s =√
MSE och “Distance value” (eller s ·√
Distance value) best¨ams fr˚an datorutskrift.
Prognosintervall f¨or y0: ˆ
y0± t[α/2](n−k−1)· s√
1 + Distance value d¨ar s =√
MSE och “Distance value” (eller s ·√
1 + Distance value) best¨ams fr˚an datorutskrift.
Partiellt F-test av H0:βg+1= . . . =βk= 0:
Testfunktion: F = (SSER− SSEC)/(k − g)
SSEC/(n − k − 1) =(SSRC− SSRR)/(k − g) SSEC/(n − k − 1)
d¨ar SSER=Residualkvadratsumman i den mindre (reducerade) modellen och SSEC=Residualkvadratsumman in den st¨orre (kompletta) modellen.
J¨amf¨or med F(k−g,n−k−1)
[α] .
Variance Inflation Factor (VIF):
VIF = 1 1 − R2j
d¨ar R2j =F¨orklaringsgraden i modell d¨ar xj ¨ar y-variabel och ¨ovriga x-variabler ¨ar f¨orklaringsvariabler.
Sekventiella kvadratsummor:
SSR = SSR(x1) + SSR(x2|x1) + . . . + SSR(xk|x1, . . . , xk−1)
d¨ar SSR(xj|x1, . . . , xj−1) ¨ar tillskottet till SSR d˚a variabel xjl¨aggs till en modell med variablerna x1, x2, . . . , xj−1. Ett partiellt F-test av H0:βg+1= . . . =βk= 0 kan d˚a g¨oras med testfunktionen
F =(SSR(xg+1|x1, . . . , xg) + SSR(xg+2|x1, . . . , xg+1) + . . . + SSR(xk|x1, . . . , xk−1)) /(k − g)
MSE , J¨amf¨or med
F(k−g,n−k−1) [α]
f¨orutsatt att variablerna matas in i ordningen x1, x2, . . . , xki modellen.
Exponentiella samband och elasticitetsmodeller:
Exponentiell modell: y =β0· (β1)x·δ d¨ar logδ∼ N(0,σ)
log y = logβ0+ (logβ1) · x + logδ Anpassad modell: ˆy = b0· (b1)x d¨ar
log b1=∑(xi− ¯x) · (log yi− log y)
∑(xi− ¯x)2 = ∑xi· log yi− n · ¯x · log y
∑x2i − n · ( ¯x)2 =
=∑xi· log yi−(∑xi)·(n∑log yi)
∑x2i −(∑nxi)2 =n ·∑xi· log yi− (∑xi) · (∑log yi) n ·∑x2i − (∑xi)2
h
log y = 1n∑log yi i
och log b0= log y − (log b1) · ¯x
Kvadratsummor, variansskattning och test:
SST =∑(log yi− log y)2=∑(log yi)2− n · (log y)2
SSE = SST − (log b1) ·∑(xi− ¯x) · (log yi− log y) = SST − (log b1) · (∑xi· log yi− n · ¯x · log y) =
∑(log yi)2− (log b0) ·∑log yi− (log b1) ·∑xi· log yi
cσ2= SSEn − 2
Test av H0:β1= 1 dvs inget samband mellan y och x ⇐⇒ logβ1= 0:
Testfunktion t = log b1
qSSE/(n−2)
∑(xi− ¯x)2
, j¨amf¨or med t[α/2](n−2)
Elasticitetsmodeller:
Q = A · (P)EP·δ, Q =α· (I)EI·δ Q = A · (P)EP· (I)EI·δ
log Q = log A + EP· log P + logδ log Q = log A + EI· log I + logδ
log Q = log A + EP· log P + EI· log I + logδ d¨ar logδ∼ N(0,σ)
Exempel p˚a anpassad modell: bQ = a · (P)EcP, d¨ar cEP=∑(log Pi− log P) · (log Qi− log Q)
∑(log Pi− log P)2 =
=∑(log Pi) · (log Qi) − n · log P · log Q
∑(log Pi)2− n · (log P)2 och
log a = log Q − cEP· log P log P = 1n∑log Pi och log Q = 1n∑log Qi
Kvadratsummor, variansskattning och test:
SST =∑(log Qi− log Q)2=∑(log Qi)2− n · (log Q)2
SSE = SST − cEP·∑(log Pi− log P) · (log Qi− log Q) = SST −EcP·
∑(log Pi) · (log Qi) − n · log P · log Q =
=∑(log Qi)2− (log a) ·∑log Qi−cEP·∑(log Pi) · (log Qi) cσ2= SSEn − 2
Test av H0: EP= B d¨ar B ¨ar ett ifr˚agasatt v¨arde p˚a EP: Testfunktion t = cEP− B
q SSE/(n−2)
∑(log Pi−log P)2
, j¨amf¨or med t[α/2](n−2)och vid enkelsidig mothypotes med t[α](n−2)eller −t[α](n−2).
Index
Sammansatta fastbasindex:
It = i1,t· w1+ i2,t· w2+ . . . + in,t· wn
d¨ar n ¨ar antalet ing˚aende varor/tj¨anster, i1,t, . . . , in,t ¨ar enkla prisindex f¨or ing˚aende varor, alla med bas˚ar t0 och w1, . . . , wnv¨aljs enligt ett viktsystem:
Laspeyre: wi= pi,t0· qi,t0
∑jpj,t0· qj,t0 Paasche: wi= pi,t0· qi,t
∑jpj,t0· qj,t Kedjeprisindex:
It = L0,1· L1,2· . . . · Lt−1,t· 100 d¨ar
Lt−1,t=
∑
n i=1pi,t
pi,t−1· wi,t−1,t
¨ar ˚arsl¨anken fr˚an ˚ar t − 1 till t f¨or n ing˚aende varor/tj¨anster. wi,t−1,t v¨aljs enligt ett viktsystem:
Laspeyre: wLi,t−1,t= F¨ors¨aljningsv¨ardet f¨or vara i ˚ar t − 1 Totala f¨ors¨aljningsv¨ardet ˚ar t − 1
Paasche: wPi,t−1,t= F¨ors¨aljningsv¨ardet f¨or vara i ˚ar t i priser f¨or ˚ar t − 1 Totala f¨ors¨aljningsv¨ardet ˚ar t i priser f¨or ˚ar t − 1
Med representantvaror byts “F¨ors¨aljningsv¨ardet f¨or vara i” mot “F¨ors¨aljningsv¨ardet f¨or varugrupp i” i vik- terna.
Implicitprisindex:
It =F¨ors¨aljningsv¨ardet av varan/tj¨ansten/gruppen ˚ar t i l¨opande priser F¨ors¨aljningsv¨ardet av varan/tj¨nasten/gruppen ˚ar t i bas˚arets priser· 100 Relativprisindex:
ItR= Itv It0· 100
d¨ar Itv=Prisindex f¨or aktuell vara/tj¨anst/grupp och It0=Prisindex f¨or den st¨orre j¨amf¨orelsegruppen, t ex KPI.
Tidsserieanalys Tidsserieregression:
Modell:
yt = TRt+ SNt+εt
d¨ar
TRt =β0+β1· t eller TRt=β0+β1· t +β2· t2 och
SNt =∑L−1i=1βsi· xsi,t med
L =Antal s¨asonger och xsi,t= 1 om t tillh¨or s¨asong i och = 0 annars.
Durbin-Watson’s test:
Test av H0: Residualerna ¨ar okorrelerade.
Testfunktion d = ∑nt=2(et− et−1)2
∑nt=1e2t d¨ar et = yt− ˆyt.
J¨amf¨orelser:
Om d < dL,α/2eller (4 − d) < dL,α/2 ⇒ F¨orkasta H0
Om d > dU,α/2och (4 − d) > dU,α/2 ⇒ F¨orkasta ej H0
Om dL,α/2≤ d ≤ dU,α/2och dL,α/2≤ (4 − d) ≤ dU,α/2⇒ Inget uttalande kan ges Komponentuppdelning:
Modeller:
Multiplikativ modell: yt = TRt· SNt· CLt· IRt
Additiv modell: yt= TRt+ SNt+ CLt+ IRt Enkel exponentiell utj¨amning:
Modell: yt =β0+εt
Uppdateringsschema f¨or skattning avβ0: `T=α· yT+ (1 −α) · `T −1 0 <α< 1 Prognos: ˆyT +τ(T ) = `T
Prognosintervall: `t± z · s ·√ 1 +α2
d¨ar z =1.96 f¨or 95% intervall, 2.576 f¨or 99% intervall och s =
q 1
T − 1·∑Tt=1(yt− ¯y)2