F¨ orel¨ asning 10 - F¨orel¨asningsanteckningar i Matematisk Statistik

10.1 Hypotespr¨ovning

L˚at oss b¨orja i den allm¨anna situationen, dvs.:

Vi har en upps¨attning data x1, x2, . . . , xn som ses som utfall av s.v.

X₁, X₂, . . . , X_n.

Dessa variabler antages vara oberoende och likafördelade och deras gemensam-ma fördelning beror av en okänd parameter θ.

En hypotes om verkligheten är i detta sammanhang en mängd av θ-värden. Formaliserat betyder detta att vi vill testa en nollhypotes

H₀ : θ ∈ H₀ mot ett alternativ (eller en mothypotes)

H1 : θ ∈ H1.

Eftersom detta blir lite abstrakt, s˚a exemplifierar vi steg f¨or steg med fallet d˚a

X₁, X₂, . . . , X_n är oberoende och N(µ, σ)-fördelade där µ och σ är okända. Exempel

H0 : µ = µ0

mot

H1 : µ 6= µ0.

Att testa H₀ är detsamma som att avgöra om v˚ara data är ”förenliga” med

H₀. Om H₀ ej är sann vill vi förkasta H0 till förm˚an för H1. Vi bildar därför en teststorhet T = T (x1, . . . , xn) och ett kritiskt omr˚ade C. (För ögonblicket

bekymrar vi oss inte för hur T och C lämpligen bildas.) Test: Förkasta H0 om T ∈ C.

I praktiken best¨ams T av situationen och C av signifikansniv˚an (eller felrisken) α:

signifikansniv˚an = α ≥ P (H₀ f¨orkastas om H0 sann)

= P (T (X1, . . . , Xn) ∈ C om H0 sann).

Med riskniv˚an garderar vi oss s˚aledes mot felet att förkasta H0 d˚a H₀ är sann. Vi bör välja H0 s˚a att detta är det allvarligase felet. Det andra möjliga felet är att ej förkasta H0 d˚a H₀ är falsk. Vi bildar styrkefunktionen

h(θ) = P (H₀ förkasta) om θ är det sanna värdet.

För θ ∈ H0 gäller s˚aledes att h(θ) ≤ α. Ett test är ”bra” om h(θ) är stor d˚a

θ ∈ H₁.

Vi h˚aller oss tills vidare till exemplet. H¨ar verkar det rimligt att utg˚a fr˚an

T (X₁, . . . , X_n) = ^{X − µ}⁰

s/^√n ^,

som under H₀ är t(n − 1)-fördelad, och att förkasta H0 om |T (x₁, . . . , x_n)| är för stor.

Vi f˚ar d˚a

α = P (|T (X₁, . . . , X_n)| > c om H₀ sann), vilket ger c = t_α/2(n − 1).

Vi kan nu binda ihop hypotesprövning med konfidensintervall, genom att kon-statera att testet är exakt detsamma som följande:

Bilda ett konfidensintervall I_µ och f¨orkasta H0 om

I_µ63 µ₀.

Detta verkar ju högst rimligt. Iµ ger ju de ”troliga” värdena p˚a µ, och om the hypotetiska värdet inte hör dit, s˚a bör ju H0 förkastas.

Om vi förkastar H0säger vi att ”µ är signifikant skilt fr˚an µ₀. Ordet signifikant är egentligen inte s˚a bra, eftersom det ofta tolkas som att skillnaden är ”viktig”, men det betyder i själva verket endast ett ”skillnaden förmodligen inte är slumpmässig”.

En god regel, om vi är intresserade av µs eventuella avvikelse fr˚an µ₀, är att först göra en hypotesprövning. Om µ är signifikant skilt fr˚an µ0, kan vi ta detta som ”alibi” för att diskutera storleken p˚a avvikelsen. Detta görs lämpligen genom att vi betraktar I_µ. P˚a detta sätt minskar vi risken för att göra en ”stor sak” av rent slumpmässig skillnad.

10.2. χ2-test 53

Ensidiga test

Vi betraktar nu f¨oljande situation:

H0 : µ = µ0

mot

H₁ : µ > µ₀ (resp. µ < µ₀).

L˚at oss anta att stort värde p˚a µ är en önskad egenskap. Det kan vara naturligt att vi gör en ˚atgärd, t.ex. köper n˚agon ny utrustning, som bör öka värdet p˚a

µ. Det är naturligt att vi endast vill köpa denna nya utrustning om vi är

n˚agolunda säkra p˚a att den verkligen ger ett högre värde p˚a µ än µ0

Det ¨ar d˚a naturligt att testa

H₀ : µ = µ₀ mot

H₁ : µ > µ₀.

Testet blir d˚a att vi förkastar H0 om T (x₁, . . . , x_n) är för stor, eller mera precist om

T > tα(n − 1) eller om ¯x > µ0+ tα(n − 1)s/^√n.

Tolkningen är att vi kräver, för att förkasta H0, att ¯x är tillräckligt mycket

större än µ0 för att det inte ska vara troligt att skillnaden är slumpmässig. Det är egentligen inte en statistisk fr˚aga hur man skall välja H1. Ofta kan det vara enklare att titta p˚a testet, för att övertyga sig att man ”garderar” sig ˚at ”rätt h˚all”. Viktigt är dock att man bestämmer sig innan man har studerat data, för annars blir signifikansniv˚an fel.

Grundregeln ¨ar dock att det vi vill p˚ast˚a skall s¨attas som H1, eftersom vi bara kan dra tv˚a slutsatser av ett test:

”H₀ förkastas ej”, vilket inte betyder att vi visat att den är sann; ”H₀ förkastas”.

Givetvis skulle vi mycket väl kunna vilja p˚ast˚a att µ = µ0, och d˚a skulle vi ju vilja testa H₀ : µ 6= µ₀ mot H₁ : µ = µ₀. Detta g˚ar inte, eftersom inga observationer i världen skulle kunna f˚a oss att förkasta detta H0.

Den som gör ett test, ”vill” därför ofta att H0 ska förkastas. Det är nog detta som gör att begreppet signifikant misstolkas.

10.2 χ

-test

Vi b¨orjar med den enklaste situationen:

Ett försök kan utfalla p˚a r olika sätt: A1, A2, . . . , Ar. L˚at x1, x2, . . . , xr vara antalet g˚anger som alternativen A₁, A₂, . . . , A_r förkommer i n försök.

L˚at p₁, p₂, . . . , p_r vara givna sannolikheter, dvs ^P^r_i=1p_i = 1. Vi vill testa

H0 : P (Ai) = pi f¨or i = 1, . . . , r mot

H₁ : ej alla P (A_i) = p_i.

F¨or att g¨ora detta bildar vi

Q_obs = r X i=1 (x_i− np_i)2 np_i ^.

Man kan visa att Q är approximativt χ2(r − 1)-fördelad under H0. (Vi till˚ater oss här att slarva lite med s.v. och dess utfall.)

För att göra resultatet troligt, betraktar vi r = 2. D˚a gäller, med X = X1 och

p = p₁ att Q = ^(X¹ ^{− np}¹⁾ 2 np₁ ⁺ (X₂− np₂)2 np₂ ⁼ (X − np)2 np ⁺ (n − X − n(1 − p))2 n(1 − p) = ^{(X − np)} 2 np ⁺ (X − np))2 n(1 − p) ⁼ (X − np)2 np(1 − p) ^.

Eftersom X ¨ar Bin(n, p) s˚a g¨aller att √^X−np

np(1−p) är appr. N(0, 1). S˚aledes följer att ^(X−np)_np(1−p)² är appr. χ2(1).

Vi gör nu följande test: Förkasta H0 om Q_obs > χ2

α(r − 1).

Ofta vill vi l˚ata sannolikheterna p₁, p₂, . . . , p_r bero av en ok¨and parameter

θ = (θ₁, . . . , θ_s), och testa hypotesen

H₀ : P (A_i) = p_i(θ), för i = 1, . . . , r, och för n˚agot värde p˚a θ.

Skattar vi θ med ML-metoden, och bildar

Q_obs = r X i=1 (x_i− np_i(θ∗ obs))2 np_i(θ∗ obs) ^, s˚a är Q approximativt χ2(r − s − 1)-fördelad under H0. Detta resultat kallas ibland för stora χ2-satsen.

10.2. χ2-test 55

Grundregeln ¨ar att antalet frihetsgrader f˚as av

antalet fria kvadratsummor − antalet skattade parametrar.

En vanlig tillämpning är att vi vill testa om ett stickprov kommer fr˚an en viss fördelning, eller en viss klass av fördelningar. Man klassindelar d˚a observatio-nerna, t.ex. enl följande:

A₁ = [g₁, g₂), A₂ = [g₂, g₃), . . . , A_r = [g_r, g_r+1), d¨ar man kan ha g1 = −∞ och/eller gr+1 = ∞.

Fördelen med χ2-testet är att man kan skatta okända parametrar, nackdelen är att klassindelningen ger viss subjektivitet.

En vanlig tumregel ¨ar att kr¨ava att alla npi eller npi(θ∗

obs) är större än 5. Homogenitetstest

Vi ˚aterg˚ar nu till exemplet i början, med ett försök som kan utfalla p˚a r olika sätt: A1, A2, . . . , Ar. Antag nu att vi har s försöksserier om n1, . . . , ns

försök vardera. L˚at x_ij vara antalet g˚anger som alternativet A_j förkommer i

ite f¨ors¨oksserien.

Serie Antal observationer av Antal f¨ors¨ok

A₁ A₂ . . . A_r

1 x₁₁ x₁₂ . . . x_1r n₁

2 x₂₁ x₂₂ . . . x_2r n₂

... ... ...

s xs1 xs2 . . . xsr ns

Vi anser att serierna ¨ar homogena om hypotesen

H₀ : P (A_i) = p_i, f¨or i = 1, . . . , r i alla serierna.

F¨or att testa H0 bildar vi

Q_obs = s X i=1 r X j=1 (xij − nip∗ j)2 nip∗ j , d¨ar p^∗_j = (p^∗_j)obs = P_s i=1x_ij P_s i=1n_i ^.

Frihetsgraderna f˚as p˚a f¨oljande s¨att:

antalet fria kvadratsummor − antalet skattade parametrar = s · (r − 1) − (r − 1) = (r − 1)(s − 1).

Oberoendetest

Vi tar nu ett stickprov om n enheter, d¨ar varje enhet klassifiseras efter tv˚a egenskaper, A och B. Vi kan skriva detta i en kontingenstabell, lik den tabell vi hade i hogenitetstestet. Egenskap A₁ A₂ . . . A_r Total B₁ x₁₁ x₁₂ . . . x_1r x_1· B₂ x₂₁ x₂₂ . . . x_2r x_2· ... ... ... B_s x_s1 x_s2 . . . x_sr x_s· Total x_·1 x_·2 . . . x_·r n

Vi vill nu testa hypotesen

H₀ : P (A_j ∩ B_i) = P (A_j)P (B_i), f¨or alla i och j. F¨or att testa H0 bildar vi

Q = s X i=1 r X j=1 (x_ij − np∗ i·p∗ ·j)2 np∗ i·p∗ ·j , d¨ar p∗ i· = (p∗

i·)_obs = ^x^i·

n ^{och p}

∗ ·j = (p∗

·j)_obs = ^x^·j

n ^.

Man kan även här visa att Q är approximativt χ2((r−1)(s−1))-fördelad under

H₀.

Frihetsgraderna f˚as p˚a f¨oljande s¨att:

antalet fria kvadratsummor − antalet skattade parametrar = (sr − 1) − [(r − 1) + (s − 1)] = sr − r − s + 1 = (r − 1)(s − 1). OBSERVERA! Även om homogenitetstestet och kontingenstabellen numeriskt och statistiskt är lika, s˚a är det olika test.

In document F¨orel¨asningsanteckningar i Matematisk Statistik (Page 59-65)