F¨orel¨asningsanteckningar i Matematisk Statistik

(1)

F¨orel¨asningsanteckningar i Matematisk Statistik

Jan Grandell

(2)

(3)

F¨ orord

Dessa anteckningar gjordes för mitt privata bruk av föreläsningsmanuskript och har aldrig varit tänkta att användas som kursmaterial. Jag kan därför inte ta n˚agot ansvar för eventuella fel och eventuella konsekvenser av dessa p˚a tentan.

Jan Grandell

i

(4)

(5)

N˚ agra beteckningar i Matematisk Statistik

Grundläggande sannolikhetsteori ω utfall av ett slumpförsök

Ω utfallsrummet

∅ tomma mängden, omöjliga händelsen A, A_k, B, . . . händelser

∩ snitt; A ∩ B = A och B intr¨affar

∪ union; A ∪ B = A och/eller B inträffar, minst en av A eller B inträffar A^∗ komplementet till A, A inträffar ej

P (A) sannolikheten f¨or A

P (B | A) sannolikheten f¨or B betingat av att A intr¨affat Stokastiska variabler

X, X_k, Y, . . . stokastiska variabler

x, xk, y, . . . utfall av stokastiska variabler F_X(x) = P (X ≤ x) f¨ordelningsfunktion

f_X(x) t¨athetsfunktion (f¨or en kontinuerlig s.v.)

p_X(x) = P (X = k) sannolikhetsfunktion (för en diskret s.v.) µ = µ_X = E(X) väntevärde, förväntat värde

σ² = σ²_X = V (X) varians

σ = σ_X = D(X) standardavvikelse C(X, Y ) kovariansen mellan X och Y

ρ = ρ(X, Y ) korrelationskoefficienten mellan X och Y Statistik

x1, x2, . . . , xn utfall av X1, X2, . . . , Xn

θ parameter

θ^∗_obs = θ^∗(x₁, . . . , x_n) punktskattning θ^∗ = θ^∗(X1, . . . , Xn) stickprovsvariabel x stickprovsmedelv¨arde¯

s² stickprovsvarians I_θ konfidensintervall f¨or θ

λ_α, t_α(f ), χ²_α(f ) α-kvantiler f¨or normal-, t- resp. χ²-f¨ordelningarna H₀ nollhypotes

H₁ alternativ hypotes, mothypotes iii

(6)

(7)

Inneh˚ all

F¨orord i

N˚agra beteckningar i Matematisk Statistik iii

F¨orel¨asning 1 1

1.1 Inledning . . . 1 1.2 Grundl¨aggande sannolikhetsteori . . . 2

F¨orel¨asning 2 7

2.1 Betingad sannolikhet . . . 7 2.2 Oberoende h¨andelser . . . 9 2.3 Stokastiska variabler . . . 11

F¨orel¨asning 3 13

3.1 Stokastiska variabler . . . 13 3.2 Flerdimensionella stokastiska variabler . . . 16

4.1 Funktioner av stokastiska variabler . . . 19 4.2 V¨antev¨arden . . . 20

5.1 Kovarians och korrelationskoefficient . . . 25 5.2 Mer om v¨antev¨arden . . . 26

6.1 Normalfördelningen . . . 29 6.2 Centrala gränsvärdessatsen . . . 32

7.1 Binomialf¨ordelningen och dess sl¨aktingar . . . 33 7.2 Approximationer . . . 35

8.1 Punktskattning . . . 39

9.1 Intervallskattning . . . 43 v

(8)

Föreläsning 10 51 10.1 Hypotesprövning . . . 51 10.2 χ²-test . . . 53

11.1 Regressionsanalys . . . 57

(9)

F¨ orel¨ asning 1

1.1 Inledning

Vi ska först ge n˚agra exempel p˚a situationer där matematisk statistik kommer in p˚a ett naturligt och viktigt sätt

Sannolikhetsteori:

Sannolikhetsteori handlar om att g¨ora modeller f¨or verkligheten.

Exempel (S)

Man vill dimensionera trafikljussystemet p˚a en genomfartsled med angränsan- de tvärgator i en stad. Hur l˚anga grön-röd faser ska man ha för att minimera risken för allt för besvärande köbildning i rusningstrafik? Biltrafik är underkas- tad slumpmässiga fluktuationer. Vi m˚aste formulera n˚agon slags slumpmodell.

Hur skall den se ut?

Exempel (D)

Man vill dimensionera ett datasystem p˚a ett företag. Hur ska man göra detta, under en given kostnadsram, för att minimera risken för allt för besvärande köbildning i rusningstrafik? Datatrafik är underkastad slumpmässiga fluktua- tioner. Vi m˚aste formulera n˚agon slags slumpmodell. Hur skall den se ut?

Statistik:

M˚anga tänker nog p˚a tabeller när de hör ordet ”statistik”. Vi menar dock med statistik läran om hur man fr˚an observationer eller analyser under osäkerhet drar slutsatser och beskriver dessa slutsatser p˚a ett korrekt sätt.

Exempel L˚at oss säga att vi vill mäta halten av ett ämne i en kemisk förening.

Hur skall vi göra detta? Det är en kemisk fr˚aga som inte jag tänker g˚a in p˚a.

Hur vi ska analysera resultaten ¨ar d¨aremot en statistisk fr˚aga!

Vi kan t.ex. ha 2000 enheter som vi är intresserade av. Detta är v˚ar population, och det är bara dom enheterna som intresserar oss. Det är alldeles för mycket arbete att analysera alla enheterna! Det naturliga är att göra ett urval av dessa, eller – som man brukar säga – ta ett stickprov. Med ett stickprov menar vi i regel en uppsättning analysdata. Hur ska vi välja stickprovet, och hur kan man

1

(10)

fr˚an resultatet av analysen av stickprovet dra slutsatser om populationen?

En lite annan situation är om vi vill undersöka en produktionsmetod. Vi har d˚a ingen naturlig population, eller om man s˚a vill, s˚a kan vi tala om en oändlig population. V˚art ”stickprov” ersätts d˚a av att vi väljer n˚agra enheter, och analyserar dessa. Man kan tänka sig att vi l˚ater framställa ett visst antal, och ur dessa gör ett urval. Skillnaden med fallet ovan är att vi nu inte vill uttala oss om det tillverkade antalet – populationen – utan om ”alla” enheter. Ett naturligare synsätt att se p˚a saken är att vi uppfattar de enskilda analyserna som resultatet av ett slumpförsök.

1.2 Grundl¨ aggande sannolikhetsteori

H¨andelser

Vi betraktar nu ett slumpf¨ors¨ok.

Definition 1.1 Varje möjligt resultat ω av ett slumpförsök kallas ett utfall, eller en elementarhändelse.

Definition 1.2 M¨angden av alla utfall, eller resultat, kallar vi utfallsrummet och betecknar det med Ω.

Definition 1.3 En händelse A är en mängd av utfall, dvs en delmängd av Ω, A ⊂ Ω.

L˚at oss nu anta att vi är intresserade av tv˚a händelser A och B definierade p˚a samma försök. Här är n˚agra exempel p˚a vad som kan inträffa, och hur vi matematiskt kan uttrycka detta:

”A intr¨affar”, A

”A och B intr¨affar” eller ”A snitt B intr¨affar”, A ∩ B

”A eller B intr¨affar” eller ”A union B intr¨affar”, A ∪ B

Obs! A ∪ B betyder att minst en av A eller B inträffar, s˚a A ∩ B kan mycket väl inträffa. I matematik betyder ”eller” och/eller!

”A intr¨affar inte”, A^∗.

Om A och B utesluter varandra, dvs. omöjligt kan inträffa samtidigt, s˚a säger vi att A och B är disjunkta eller oförenliga, dvs. A ∩ B = ∅ där ∅ är ”tomma mängden” eller ”den omöjliga händelsen”.

(11)

1.2. Grundl¨aggande sannolikhetsteori 3

Har vi m˚anga händelser kan vi, precis som med summa- och produkt-tecken, använda ett förkortat skrivsätt:

[n 1

Ai = A1∪ A2∪ . . . ∪ An och

\n 1

Ai = A1∩ A2∩ . . . ∩ An

L˚at oss säga att vi kastar en tärning, och är intresserade av händelsen {vi f˚ar en sexa}.

Alla h˚aller nog med om att, om det ¨ar en just t¨arning, att den sannolikheten

¨ar ¹₆. Symboliskt kan vi skriva

A = {vi f˚ar en sexa} och P (A) = 1 6.

Ar det ¨overhuvudtaget meningsfullt att tala om sannolikheter, och om s˚¨ a ¨ar fallet, hur skall man tolka dessa?

Vi skall tolka detta som att om man kastar tärningen m˚anga g˚anger, s˚a blir den relativa frekvensen 6or ungefär ¹₆. Allmänt sett, om vi har ett försök och en händelse A och gör försöket n g˚anger, s˚a gäller

f_n(A) = antalet g˚anger A intr¨affar

n → P (A) d˚a n v¨axer.

Vad ¨ar nu en sannolikhet?

Kolmogorovs axiomsystem (1933):

Ett sannolikhetsm˚att P ¨ar en funktion av h¨andelser, s˚adan att:

(a) 0 ≤ P (A) ≤ 1;

(b) P (Ω) = 1;

(c) om A₁, A₂, . . . är disjunkta händelser, s˚a gäller

P µ[_∞

1

A_i

¶

= X∞

1

P (A_i).

(a) och (b) kan ses som en kalibrering s˚a att P stämmer med intuitionen (det blir lättare d˚a) och (c) (som är det ”viktiga” axiomet) betyder att P är ett m˚att.

Sats 1.1 P (A^∗) = 1 − P (A).

(12)

Bevis. Vi ska ge ett mycket formellt bevis, f¨or att illustrera axiomsystemet:

Eftersom A och A^∗ disjunkta och A ∪ A^∗ = Ω, s˚a f˚as

P (A) + P (A^∗) = P (Ω) = 1 ⇒ P (A^∗) = 1 − P (A).

2

Sats 1.2 P (A ∪ B) = P (A) + P (B) − P (A ∩ B).

Bevis. Satsen f¨oljer med hj¨alp av Venn-diagram, och observationen att

P (A) + P (B) ”m¨ater” A ∩ B tv˚a g˚anger. 2

Den klassiska sannolikhetsdefinitionen

Antag att Ω best˚ar av m (möjliga) elementarhändelser ω1, . . . , ω_m, var och en med samma sannolikhet att inträffa, dvs

P (ωk) = 1

m k = 1, . . . , m.

Betrakta en händelse A, A ⊂ Ω. Antag att A inneh˚aller g (gynnsamma) ele- mentarhändelser. D˚a gäller

P (A) = g m.

Problemt med den klassiska sannolikhetsdefinitionen, i mera komplicerade situationer, är att hitta en uppdelning av Ω i lika sannolika elementarhändelser och att beräkna m och g. I m˚anga – de flesta – situationer är det inte alls möjligt att göra detta.

För att beräkna m och g behöver vi n˚agra kombinatoriska grundbegrepp:

n st. f¨orem˚al kan permuteras eller ordnas p˚a n! = n · (n − 1) . . . 2 · 1 olika s¨att.

Det finns µ

n k

¶

= n!

k!(n − k)!

olika s¨att att plocka ut k st. av dessa om vi ej tar h¨ansyn till i vilken ordning de plockas ut.

Det finns n^k olika sätt att plocka ut k st. av dessa om varje förem˚al som har plockats ut stoppas tillbaka och om vi tar hänsyn till i vilken ordning de plockas ut.

(13)

1.2. Grundl¨aggande sannolikhetsteori 5

Tv˚a urnmodeller

Dragning utan ˚aterl¨aggning

I en urna finns kulor av tv˚a slag: v vita och s svarta. Drag n kulor ur urnan slumpm¨assigt och s˚a att en kula som dragits inte stoppas tillbaka. dvs dragning utan ˚aterl¨aggning.

S¨att A = ”Man f˚ar k vita kulor i urvalet”.

Välj Ω: Alla uppsättningar om n kulor utan hänsyn till ordning.

D˚a f˚as:

m =

µv + s n

¶

och g = µv

k

¶µ s n − k

¶

och s˚aledes

P (A) =

¡_v

k

¢¡ _s

n−k

¢

¡_v+s

n

¢ .

Dragning med ˚aterl¨aggning

Samma modell som i fallet med dragning utan ˚aterläggning, men kulorna stoppas tillbaka igen efter det att man observerat dess färg, och urnan skakas om för nästa dragning.

Välj Ω: Alla uppsättningar om n kulor med hänsyn till ordning:

m = (v + s)ⁿ.

Antag att vi valt ut k vita och n − k svarta kulor. Dessa kan placeras p˚a ¡_n

k

¢ platser:

v v v · · · v

Antal sätt att välja ut k vita = v^k. Antal sätt att välja ut n − k svarta = s^n−k. Detta ger g =¡_n

k

¢v^ks^n−k och s˚aledes f˚ar vi

P (A) =

¡_n

k

¢v^ks^n−k (v + s)ⁿ =

µn k

¶ µ v v + s

¶_kµ s v + s

¶_n−k .

(14)

(15)

F¨ orel¨ asning 2

2.1 Betingad sannolikhet

Vi p˚aminner om relativa frekvensers stabilitet:

Om vi har ett försök och en händelse A och gör försöket n g˚anger, s˚a gäller f_n(A) = antalet g˚anger A inträffar

antalet försök → P (A) d˚a n växer.

L˚at A och B vara tv˚a händelser, dvs A, B ⊂ Ω. Vad är P (B | A), dvs sanno- likheten för B d˚a vi vet att A har inträffat?

Det borde g¨alla att

P (B | A)

≈ antalet g˚anger A ∩ B intr¨affar antalet g˚anger A intr¨affar

= antalet g˚anger A ∩ B intr¨affar

antalet försök · antalet försök antalet g˚anger A inträffar

≈ P (A ∩ B) P (A) . Detta leder oss till f¨oljande definition.

Definition 2.1 L˚at A och B vara tv˚a h¨andelser. Antag att P (A) > 0. Sanno- likheten f¨or B betingat av A betecknas med P (B | A) och definieras som

P (B | A) = P (A ∩ B) P (A) . Exempel (Kast med röd och vit tärning) A = summan av ögonen är högst 4.

Bk = vita t¨arningen visar k ¨ogon.

P (B_k | A) = 0 om k ≥ 4.

7

(16)

M¨ojliga utfall, m, ¨ar 36: (v, r), v, r = 1, . . . 6, dvs (1, 1), (1, 2), . . . (6, 6).

Gynnsamma utfall f¨or A, ¨ar 6: (1,1), (1,2), (1,3), (2,1), (2,2), (3,1).

Gynnsamma utfall f¨or A ∩ Bk, ¨ar 4 − k: (v, r), v = k, r = 1, . . . 4 − k, dvs (k, 1), (k, 2), . . . (k, 4 − k) om k < 4.

Klassiska sannolikhetsdefinitionen ger P (A) = 6

36 och P (A ∩ B_k) = 4 − k 36 . Detta ger, f¨or k < 4,

P (B_k| A) = 4 − k

6 =







3

6 = ¹₂ k = 1

2

6 = ¹₃ k = 2

1

6 k = 3.

Ofta är det lättare att ange värden till betingade sannolikheter än till obeting- ade, och vi utnyttar definitionen ”baklänges”.

Exempel

En ohederlig person har tv˚a t¨arningar, en ¨akta och en falsk som alltid ger 6

ögon. Han väljer slumpmässigt den ena. Vad är sannolikheten för 5 resp. 6 ögon.

L˚at oss betrakta fallet med sex ögon. Intiuitivt bör gälla att sannolikheten är 1

2 ·1 6 +1

2 · 1 = 1 12 + 6

12 = 7 12. Mera systematiskt g¨aller f¨oljande sats

Sats 2.1 (Lagen om total sannolikhet)

Om H₁, . . . , H_n är disjunkta händelser, har positiv sannolikhet och uppfyller hela Ω, s˚a gäller för varje händelse A ⊂ Ω att

P (A) = Xn

i=1

P (H_i)P (A | H_i).

Bevis. Vi har

P (A) = P (A ∩ Ω) = P (A ∩ (H₁∪ . . . ∪ H_n)) = P ((A ∩ H₁) ∪ . . . ∪ (A ∩ H_n))

= Xn

i=1

P (A ∩ H_i) = Xn

i=1

P (H_i)P (A | H_i).

2 Vi ska nu ge en viktig sats om ”v¨andning” av h¨andelserna i betingade sannolikheter.

(17)

2.2. Oberoende h¨andelser 9

Sats 2.2 (Bayes’ sats) Under samma villkor som i lagen om total sannolik- het g¨aller

P (H_i | A) = P (Hi)P (A | Hi) P_n

j=1P (H_j)P (A | H_j). Bevis.

P (H_i | A) = P (Hi∩ A)

P (A) = P (Hi∩ A)

P (H_i) · P (Hi)

P (A) = P (A | H_i) ·P (Hi) P (A) . Lagen om total sannolikhet till¨ampad p˚a P (A) ger resultatet. 2 L˚at oss g˚a tillbaka till exemplet om falskspelaren. S¨att

A = 6 ¨ogon.

H₁ = ¨akta t¨arningen.

H₂ = falska t¨arningen.

D˚a g¨aller

P (A) = P (H₁)P (A | H₁) + P (H₂)P (A | H₂) = 1 2 · 1

6+ 1

2· 1 = 7 12, som i exemplet. Bayes’ sats ger vidare

P (H₁ | A) = P (H₁∩ A)

P (A) = P (A | H₁) · P (H₁) P (A) = 1

6 1 2

12 7 = 1

7 och

P (H₂ | A) = P (H₂∩ A)

P (A) = P (A | H₂) ·P (H₂)

P (A) = 1 · 1 2

12 7 = 6

7 vilket kanske inte ¨ar lika l¨att att inse rent intiuitivt.

2.2 Oberoende h¨ andelser

Intiuitivt är tv˚a händelser A och B oberoende om inträffandet av A inte ger n˚agon information om huruvida B inträffar eller ej. I formler betyder detta

P (B | A) = P (B).

Allm¨ant g¨aller ju

P (B | A) = P (A ∩ B)

P (A) , om P (A) > 0.

Multiplikation med P (A) leder oss till f¨oljande definition:

Definition 2.2 Tv˚a h¨andelser A och B ¨ar oberoende om P (A ∩ B) = P (A)P (B).

(18)

Definitionen ovan kr¨aver inget villkor om positiva sannolikheter.

Det är inte självklart hur oberoende skall definieras för flera händelser.

Definition 2.3 Tre h¨andelser A, B och C ¨ar oberoende om P (A ∩ B) = P (A)P (B)

P (A ∩ C) = P (A)P (C) P (B ∩ C) = P (B)P (C) P (A ∩ B ∩ C) = P (A)P (B)P (C).

Endast P (A ∩ B ∩ C) = P (A)P (B)P (C) r¨acker inte, vilket inses om vi s¨atter A = B och C = ∅.

Inte heller r¨acker parvis oberoende, vilket ses av f¨oljande exempel:

Kast med r¨od och vit t¨arning:

A = vita tärningen visar jämnt antal ögon.

B = röda tärningen visar jämnt antal ögon.

C = j¨amn ¨ogonsumma.

A och B är oberoende av ”försöksskäl”. Vidare gäller P (A ∩ C) = P (A ∩ B) = P (A)P (B) = 1

4 och P (A)P (C) = 1 4. S˚aledes är A och C oberoende. Pss. följer att B och C är oberoende.

Eftersom A∩B ⇒ C vore det inte rimligt att anse att A, B och C ¨ar oberoende.

Allmänt: Oavsett vilka händelser vi plockar ut s˚a skall sannolikheten för snittet vara produkten av sannolikheterna.

Man kan visa att om A1, . . . , Anär oberoende, s˚a är även A^∗₁, . . . , A^∗_noberoende.

Detta kan verka helt självklart, med är inte helt lätt att visa. Vi nöjer oss med fallet n = 2.

Vi har

P (A^∗∩ B^∗) = P ((A ∪ B)^∗) = 1 − P (A ∪ B)

= 1 − P (A) − P (B) + P (A)P (B) = 1 − P (A) − P (B)(1 − P (A))

= (1 − P (A))(1 − P (B)) = P (A^∗)P (B^∗).

Sats 2.3 L˚at h¨andelserna A1, . . . , A_n vara oberoende. S¨att B = S_n

1 A_i, dvs.

minst en av händelserna A1, . . . , A_n inträffar. D˚a gäller

P (B) = 1 − (1 − P (A₁))(1 − P (A₂)) . . . (1 − P (A_n)).

(19)

2.3. Stokastiska variabler 11

Bevis.

P (B) = 1 − P (B^∗) = 1 − P Ã _n

\

1

A^∗_i

!

= 1 − Yn

1

P (A^∗_i) = 1 − Yn

1

(1 − P (A_i)).

2

2.3 Stokastiska variabler

I nästan alla situationer som vi betraktar, kommer resultaten av slumpförsöken att vara tal, kontinerliga mätvärden eller antal. Det är praktiskt att anpassa beteckningarna till detta.

Definition 2.4 En stokastisk variabel s.v. (eller en slumpvariabel) X ¨ar en funktion fr˚an Ω till reella linjen.

Lite löst kommer vi att uppfatta X som en beteckning för resultatet av ett slumpförsök.

För ett tärningskast kan X anta ett av värdena 1, 2, 3, 4, 5 eller 6.

L˚at X vara en stokastisk variabel. Det mest allmänna sättet att beskriva X, dvs. hur X varierar, är att ange dess fördelningsfunktion.

Definition 2.5 F¨ordelningsfunktionen FX(x) till en s.v. X definieras av F_X(x) = P (X ≤ x).

En f¨ordelningsfunktion FX(x) har f¨oljande egenskaper:

1) F_X(x) ¨ar icke-avtagande;

2) F_X(x) → 1 d˚a x → ∞;

3) F_X(x) → 0 d˚a x → −∞;

4) FX(x) ¨ar h¨ogerkontinuerlig.

(20)

(21)

F¨ orel¨ asning 3

3.1 Stokastiska variabler

Det är lämpligt att skilja p˚a fallen d˚a v˚ar stokastiska variabel representerar kontinuerliga mätvärden eller antal.

Diskret stokastisk variabel Vi ska nu betrakta fallet med antal.

Definition 3.1 En s.v. X säges vara diskret om den kan anta ett ändligt eller uppräkneligt oändligt antal olika värden.

Det viktiga är att de möjliga värdena ligger i en ändlig eller högst uppräknelig mängd. Oftast tar en diskret s.v. icke-negativa heltalsvärden ”räknar ett antal”. Vi kommer att förutsätta detta, om vi inte explicit säger n˚agot annat.

Definition 3.2 F¨or en diskret s.v. definieras sannolikhetsfunktionen pX(k) av

p_X(k) = P (X = k).

Om X beskriver ett t¨arningskast g¨aller s˚aledes p_X(k) =

(1

6 för k = 1, 2, 3, 4, 5, 6 0 för övriga värden p˚a k.

Gör vi nu slumpförsöket att p˚a m˚af˚a dra en av 6 lappar med talen 1, 2, 3, 4, 5 eller 6, s˚a f˚ar vi samma s.v. som i tärningskasten.

Relationen mellan sannolikhetsfunktionen och f¨ordelningsfunktionen f¨or en diskret stokastisk variabel f˚as av sambanden

F_X(x) = X

j≤[x]

p_X(j), d¨ar [x] betyder heltalsdelen av x,

och

p_X(k) = F_X(k) − F_X(k − 1) ¡

= F_X(k + ¹₂) − F_X(k − ¹₂)¢ . 13

(22)

Det f¨oljer av detta att

p_X(k) ≥ 0 och X∞

0

p_X(k) = 1.

Binomialf¨ordelningen

L˚at oss betrakta fallet ”dragning med ˚aterläggning”, och l˚at X vara antalet vita kulor i urvalet om n kulor. Sätt p = _v+s^v , dvs. p är sannolikheten för en vit kula. D˚a f˚as

p_X(k) = µn

k

¶

p^k(1 − p)^n−k, f¨or k = 0, 1, . . . , n.

Nu är det inte alls nödvändigt att p är ett rationellt tal, utan vi kan allmännt betrakta ett försök där en händelse A med p = P (A) kan inträffa, och l˚ata X vara antaltet g˚anger som A inträffar i n oberoende upprepningar av detta försök.

Definition 3.3 En diskret s.v. X säges vara binomialfördelad med paramet- rarna n och p, Bin(n, p)-fördelad, om

pX(k) = µn

k

¶

p^k(1 − p)^n−k, f¨or k = 0, 1, . . . , n.

Poissonf¨ordelningen

Ofta när det är rimligt att anta att en s.v. X är Bin(n, p)-fördelad, s˚a är det

även rimligt att anta att p är liten och att n är stor. L˚at oss anta att p = µ/n, där n är ”stor” men µ är ”lagom”. D˚a gäller

p_X(k) = µn

k

¶

p^k(1 − p)^n−k = n(n − 1) . . . (n − k + 1) k!

³µ n

´_k³ 1 − µ

n

´_n−k

= µ^k k!

³ 1 −µ

n

´_n

| {z }

≈ e^−µ

n(n − 1) . . . (n − k + 1) n^k

| {z }

≈ 1

³ 1 − µ

n

´_−k

| {z }

≈ 1

≈ µ^k k! e^−µ.

Definition 3.4 En diskret s.v. X säges vara Poissonfördelad med parameter µ, Po(µ)-fördelad, om

p_X(k) = µ^k

k! e^−µ, f¨or k = 0, 1, 2 . . . . Kontinuerlig stokastisk variabel

Här kan vi tyvärr inte ge definitionen i termer av den stokastiska variabeln själv. Det räcker inte att säga att X kan ta ett överuppräneligt antal värden.

Vi f˚ar därför ge definitionen i termer av fördelningsfunktionen, som ju är den allmännaste beskrivningen av en s.v.

(23)

3.1. Stokastiska variabler 15

Definition 3.5 En s.v. X säges vara kontinuerlig om dess fördelningsfunktion har framställningen

F_X(x) = Z _x

−∞

f_X(t) dt

för n˚agon funktion f_X(x). Funktionen f_X(x) kallas täthetsfunktionen för X.

Omv¨ant g¨aller att fX(x) = F_X⁰ (x).

T¨athetsfunktionen och sannolikhetsfunktionen kommer ofta att upptr¨ada ”pa- rallellt”.

Täthetsfunktionen kan inte direkt tolkas som en sannolikhet, men vi har, för sm˚a värden p˚a h,

P (x < X ≤ x + h) = FX(x + h) − FX(x) = Z _x+h

x

fX(t) dt ≈ h fX(x).

Ett par begrepp:

Definition 3.6 L¨osningen till ekvationen 1 − FX(x) = α kallas α-kvantilen till X och betecknas med x_α.

Rita figur!

x0.5 kallas för medianen och är s˚aledes det värde som överskrides med samma sannolikhet som det underskrides.

Likformig f¨ordelning U(a, b)

fX(x) = ( 1

b−a f¨or a ≤ x ≤ b,

0 annars.

F_X(x) =







0 f¨or x ≤ a,

x−a

b−a f¨or a ≤ x ≤ b, 1 f¨or x ≥ b.

Rita figur!

(24)

Exponentialf¨ordelningen Exp(λ) f_X(x) =

(λ e^−λx f¨or x ≥ 0, 0 f¨or x < 0.

F_X(x) = (

1 − e^−λx f¨or x ≥ 0, 0 f¨or x < 0.

Denna fördelning är viktig i väntetidsproblem. För att inse detta s˚a tar vi ett enkelt exempel:

Antag att n personer g˚ar förbi en affär per tidsenhet. L˚at var och en av dessa g˚a in i affären oberoende av varandra och med sannolikheten p. L˚at X vara tiden tills första kunden kommer. X > x betyder att ingen kund kommit efter x tidsenheter.

P (X > x) = (1 − p)^nx ty nx personer har g˚att f¨orbi.

L˚at oss anta precis som d˚a vi ”härledde” Poissonfördelningen, att p = µ/n, där n är ”stor” men µ är ”lagom”. D˚a gäller

P (X > x) = (1 − p)^nx = (1 − µ

n)^nx ≈ e^−µx.

Detta ger att F_X(x) = 1 − P (X > x) ≈ 1 − e^−µx, dvs X är approximativt Exp(µ). Observera att väntevärdet (ännu ej definierat, men det kommer) är 1/µ!

Normalf¨ordelningen.

fX(x) = 1 σ√

2πe^−(x−µ)²^/2σ² d¨ar µ godtycklig konstant och σ > 0.

Denna fördelning är mycket viktig, och vi skall ˚aterkomma till den. Man kan inte analytiskt ge fördelningsfunktionen, vilket kan tyckas lite taskigt.

3.2 Flerdimensionella stokastiska variabler

Ofta mäter vi i samma slumpförsök flera storheter, och d˚a beskrivs resultatet av en n-dimensionell stokastisk variabel (X₁, X₂, . . . , X_n).

Exempel

Slumpförsöket är att vi väljer en person slumpmässigt här i rummet, och sätter X = personens vikt;

Y = personens l¨angd.

Vi n¨ojer oss med att ge detaljer i det tv˚a-dimensionella fallet. L˚at (X,Y) vara en tv˚a-dimensionell s.v.

(25)

3.2. Flerdimensionella stokastiska variabler 17

FX,Y(x, y) = P (X ≤ x, Y ≤ y) kallas (den simultana) f¨ordelningsfunktionen f¨or (X, Y ).

F_X(x) = P (X ≤ x) = P (X ≤ x, Y ≤ ∞) = F_X,Y(x, ∞) kallas den marginella f¨ordelningsfunktionen f¨or X.

F_Y(y) = F_X,Y(∞, y) kallas den marginella fördelningsfunktionen för Y . Definition 3.7 X och Y är oberoende stokastiska variabler om

F_X,Y(x, y) = F_X(x)F_Y(y)

Vi kommer ih˚ag att för händelser s˚a var det inte helt lätt att generlisera till godtyckligt antal. För s.v. är det dock skenbart enklare.

Definition 3.8 (X1, X2, . . . , Xn) ¨ar oberoende stokastiska variabler om F_X₁_,...,X_n(x₁, . . . , x_n) = P (X₁ ≤ x₁, . . . , X_n ≤ x_n)

= F_X₁(x₁) · · · F_X_n(x_n).

Kommentera!

Omvänt gäller att om X1, X₂, . . . , X_n är oberoende s.v. s˚a f˚as den simultana fördelningen enl. definitionen ovan.

(26)

(27)

F¨ orel¨ asning 4

4.1 Funktioner av stokastiska variabler

Största och minsta värdets fördelning

L˚at X₁, X₂, . . . , X_n vara oberoende s.v. med resp. f¨ordelningsfunktioner F_X₁(x₁), . . . , F_X_n(x_n).

S¨att

Y = max(X₁, X₂, . . . , X_n) Z = min(X₁, X₂, . . . , X_n).

Vi har

F_Y(y) = P (Y ≤ y) = P (alla X_i ≤ y) = F_X₁(y) · · · F_X_n(y) och

F_Z(z) = P (min(X₁, X₂, . . . , X_n) ≤ z)

= 1 − P (min(X₁, X₂, . . . , X_n) > z) = 1 − P (alla X_i > z)

= 1 − P (X₁ > z) · · · P (X_n > z) = 1 − (1 − F_X₁(z)) · · · (1 − F_X_n(z)).

Summans f¨ordelning

L˚at X och Y vara tv˚a oberoende kontinuerliga stokastiska variabler med t¨atheter f_X(x) och f_Y(y).

S¨att Z = X + Y . D˚a g¨aller

F_Z(z) = P (X + Y ≤ z) = P ((X, Y ) ∈ {(x, y); x + y ≤ z})

= Z

x+y≤z

f_X(x)f_Y(y) dx dy (fixera x och integrera ¨over y)

= Z _∞

−∞

f_X(x)

µZ _z−x

−∞

f_Y(y) dy

¶ dx

19

(28)

=

−∞

f_X(x)F_Y(z − x) dx.

Z ¨ar ocks˚a en kontinuerlig stokastisk variabel. Derivation map. z ger f_Z(z) = F_Z⁰(z) =

Z _∞

−∞

f_X(x)f_Y(z − x) dx.

Denna operation kallas faltning.

4.2 V¨ antev¨ arden

Vi ska nu införa begreppet väntevärde för en s.v. Detta är den teoretiska motsvarigveten till begreppet medelvärde för en talföljd.

Antag att vi har en l˚ang talföljd x1, . . . , x_n, där talen är ganska sm˚a heltal.

Medelv¨ardet definierades av

¯ x = 1

n Xn k=1

x_k.

Det kan vara bekv¨amt att g¨ora omskrivningen

¯ x =

X∞ i=0

i · f_i,

d¨ar

f_i = antalet {k; x_k = i}

n .

N¨ar vi diskuterade tolkningen av begreppet sannolikhet, s˚a sa vi att antalet g˚anger A intr¨affar

n → P (A) d˚a n v¨axer.

För diskreta s.v. gäller d˚a att f_k → p_X(k) d˚a k → ∞. Vi leds av detta till följande definition:

Definition 4.1 Väntevärdet µ för en s.v. X är

µ = E(X) =

(P_∞

k=0kp_X(k) i diskreta fallet, R_∞

−∞xf_X(x) dx i kontinuerliga fallet.

Vi skall alltid anta att X∞ k=0

|k|p_X(k) < ∞ och

Z _∞

−∞

|x|f_X(x) dx < ∞.

(29)

4.2. V¨antev¨arden 21

Väntevärdet ger samma information och samma brist p˚a information för den s.v. som melelvärdet ger för en talföljd.

L˚at oss tänka p˚a tärningskast igen. Hur mycket skulle ni vara villiga att betala för följande spel: Jag kastar en tärning, och ni f˚ar lika m˚anga kronor som det blir ögon?

Vi har

p_X(k) = (1

6 för k = 1, 2, 3, 4, 5, 6 0 för övriga värden p˚a k, vilket ger

E(X) = X∞ k=0

kp_X(k) = X6

k=1

k1

6 = 3.5.

p_X(k) = µ^k

k! e^−µ, f¨or k = 1, 2 . . . . E(X) =

X∞ k=0

k ·µ^k

k! e^−µ= X∞

k=1

k · µ^k

k! e^−µ= X∞ k=1

µ^k

(k − 1)!e^−µ

= µ X∞ k=1

µ^k−1

(k − 1)!e^−µ= µ X∞

i=0

µⁱ

i! e^−µ= µ.

Exponentialf¨ordelningen

f_X(x) =

(λ e^−λx f¨or x ≥ 0, 0 f¨or x < 0.

E(X) = Z _∞

−∞

xfX(x) dx = Z _∞

0

xλ e^−λxdx =



 y = λx x = y/λ dx = dy/λ





= 1 λ

Z _∞

0

ye^−ydy = 1 λ

£−ye^−y¤_∞

0 + 1 λ

Z _∞

0

e^−ydy = 0 − 1 λ

£e^−y¤_∞

0 = 1 λ. Antag att vi känner förd. för X, och vill beräkna E(Y ) där Y = g(X).

F¨oljande, skenbart oskyldiga, sats ¨ar ordentligt sv˚ar att bevisa i det kontinuerliga fallet

Sats 4.1 Väntevärdet för g(X) är

E(g(X)) =

(P_∞

k=0g(k)p_X(k) i diskreta fallet, R_∞

−∞g(x)f_X(x) dx i kontinuerliga fallet.

(30)

Bevis. Blom m.fl. visar satsen i det diskreta fallet, s˚a vi betraktar det kontinuerliga fallet. Vi begränsar oss dock till fallet d˚a g är strikt växande. Denna begränsning förenklar beviset högst avsevärt.

L˚at g⁻¹(x) vara inversen till g. D˚a g¨aller

F_Y(y) = P (Y ≤ y) = P (g(X) ≤ y) = P (X ≤ g⁻¹(y)) = F_X(g⁻¹(y)) vilket ger

f_Y(y) = dF_X(g⁻¹(y))

dy = dF_X⁰ (g⁻¹(y))dg⁻¹(y)

dy = f_X(g⁻¹(y))dg⁻¹(y) dy . Av detta f˚as

E(Y ) = Z _∞

−∞

yf_X(g⁻¹(y))dg⁻¹(y) dy dy

=





x = g⁻¹(y) dx = ^dg⁻¹_dy^(y)dy

y = g(x)



 = Z _∞

−∞

g(x)fX(x) dx.

2 Fr˚an denna sats f¨oljer bl.a. f¨oljande:

E(h(X) + g(X)) = E(h(X)) + E(g(X)) med det viktiga specialfallet

E(aX + b) = aE(X) + b.

Spridningsm˚att

Väntevärdet säger ingen om hur X varierar.

Diskutera

|X − µ| och (X − µ)² och dess egenskaper!

Vi leds nu till f¨oljande definition.

Definition 4.2 Variansen σ² f¨or en s.v. X ¨ar σ² = V (X) = E[(X − µ)²].

Följande räkneregel är mycket användbar:

Sats 4.2 V (X) = E(X²) − [E(X)]² = E(X²) − µ².

(31)

4.2. V¨antev¨arden 23

Bevis.

V (X) = E[(X − µ)²] = E[X²+ µ²− 2µX]

= E[X²] + µ²− 2µE[X] = E(X²) − µ².

2 I exemplet med t¨arningsspel har vi µ = 3.5 = ²¹₆. Vidare har vi

E(X²) = X∞ k=−∞

k²pX(k) = X6 k=1

k²1 6 = 91

6 = 15.16 Enligt r¨akneregeln f˚as

V (X) = 91 6 −

µ21 6

¶₂

= 546 − 441

36 = 2.92.

Sats 4.3 V (aX + b) = a²V (X).

Bevis.

V (aX + b) = E[(aX + b − E(aX + b))²] = E[(aX + b − aµ − b)²]

= E[(aX − aµ)²] = a²E[(X − µ)²] = a²V (X).

2

Definition 4.3 Standardavvikelsen σ f¨or en s.v. X ¨ar σ = D(X) =p

V (X).

Sats 4.4 D(aX + b) = |a|D(X).

Allm¨ant g¨aller:

D – r¨att sort.

V – l¨attare att r¨akna med.

Exponentialf¨ordelningen.

E(X²) = Z _∞

0

x²λe^−λxdx = 1 λ²

Z _∞

0

y²e^−ydy = part. int. = 2 λ²

⇔ V (X) = 2

λ² − 1 λ² = 1

λ² ⇔ D(X) = 1 λ.

(32)

E(X(X − 1)) = X∞

k=0

k(k − 1) · µ^k

k! e^−µ= X∞ k=2

k(k − 1) ·µ^k k! e^−µ

= X∞ k=2

µ^k

(k − 2)!e^−µ= µ² X∞ k=2

µ^k−2

(k − 2)!e^−µ= µ² X∞

i=0

µⁱ

i! e^−µ= µ².

Detta ger µ² = E(X(X − 1)) = E(X²) − µ, eller E(X²) = µ²+ µ, vilket ger V (X) = E(X²) − µ² = µ²+ µ − µ² = µ.

(33)

F¨ orel¨ asning 5

5.1 Kovarians och korrelationskoefficient

L˚at (X, Y ) vara en tv˚adimensionell s.v. d¨ar vi ¨ar intresserade av sambandet mellan Xs och Y s variation. Det kan vara natuligt att betrakta variablerna

X − µX och Y − µY.

Vi skiljer p˚a fallen d˚a X och Y ”samvarierar” resp. ”motverkar varandra”, dvs.

d˚a

ett stort/litet värde p˚a X gör ett stort/litet värde p˚a Y troligt resp.

ett stort/litet värde p˚a X gör ett litet/stort värde p˚a Y troligt.

Betraktar vi nu variabeln

(X − µ_X)(Y − µ_Y),

s˚a innebär detta att den i första fallet, eftersom + · + = + och − · − = +, att den har en tendens att vara positiv. P˚a motsvarande sätt, eftersom − · + = − och + · − = −, har den i andra fallet en tendens att vara negativ. Det som vi, lite slarvigt, har kallat tendens, kan vi ersätta med väntevärde. Vi leds d˚a till följande definition.

Definition 5.1 Kovariansen mellan X och Y ¨ar C(X, Y ) = E[(X − µ_X)(Y − µ_Y)], d¨ar µX = E(X) och µ_Y = E(Y ).

Kovariansen kan s¨agas ha fel sort. Det verkar rimligt att ett m˚att p˚a ett s˚a abstrakt begrepp som samvariation skall vara ”sortfritt”. Det vanligaste m˚attet

¨ar korrelationskoefficienten.

Definition 5.2 Korrelationskoefficienten mellan X och Y ¨ar ρ = ρ(X, Y ) = C(X, Y )

D(X)D(Y ). 25

(34)

Man kan visa att |ρ| ≤ 1, d¨ar |ρ| = ±1 betyder att det finns ett perfekt linj¨art samband, dvs. Y = aX + b.

Sats 5.1 Om X och Y ¨ar oberoende s˚a ¨ar de okorrelerade, dvs. ρ(X, Y ) = 0.

Omv¨andningen g¨aller ej, dvs. okorrelerade variabler kan vara beroende.

Exempel

L˚at (X, Y ) vara en tv˚adimensionell diskret variabel med f¨oljande sannolikhetsfunktion:

pX,Y(i, j) = (1

4 om (i, j) = (0, 1), (0, −1), (1, 0), eller (−1, 0).

0 annars.

Rita!

Uppenbarligen är dessa variabler beroende. Av symmetrin följer att µX = µ_Y = 0. Variabeln XY tar alltid värdet 0. S˚aledes f˚as

C(X, Y ) = E(XY ) = 0.

Om (X, Y ) är tv˚adimensionellt normalfördelad, s˚a innebär dock ρ = 0 att X och Y är oberoende.

Varning Korrelationskoefficienten ¨ar sv˚artolkad!

5.2 Mer om v¨ antev¨ arden

Sats 5.2 L˚at (X, Y ) vara en tv˚adimensionell s.v. D˚a g¨aller (1) E(aX + bY ) = aE(X) + bE(Y );

(2) V (aX + bY ) = a²V (X) + b²V (Y ) + 2abC(X, Y ).

Bevis. (1) följer av av räknereglerna för integraler resp. summor.

(2) f˚as av f¨oljande

V (aX + bY ) = E[(aX + bY − aµ_X − bµ_Y)²] = E[(aX − aµ_X + bY − bµ_Y)²]

= E[a²(X − µ_X)²+ b²(Y − µ_Y)²+ 2ab(X − µ_X)(Y − µ_Y)]

= a²V (X) + b²V (Y ) + 2abC(X, Y ).

2

(35)

5.2. Mer om v¨antev¨arden 27

F¨oljdsats 5.1 L˚at X och Y vara tv˚a oberoende (okorrelerade r¨acker) s.v. D˚a g¨aller

E(X + Y ) = E(X) + E(Y ) V (X + Y ) = V (X) + V (Y ) E(X − Y ) = E(X) − E(Y ) V (X − Y ) = V (X) + V (Y ).

Detta g˚ar att utvidga till godtyckligt m˚anga variabler:

Sats 5.3 L˚at X₁, . . . , X_n vara oberoende (okorrelerade r¨acker) s.v. och s¨att Y = c₁X₁+ . . . + c_nX_n.

D˚a g¨aller

E(Y ) = c1E(X1) + . . . + cnE(Xn) och

V (Y ) = c²₁V (X₁) + . . . + c²_nV (X_n) Arimetiskt medelv¨arde

Sats 5.4 L˚at X₁, X₂, . . . , X_n vara oberoende och likafördelade s.v. med vänte- värde µ och standardavvikelse σ. D˚a gäller att

E(X) = µ, V (X) = σ²

n och D(X) = σ

√n .

Uttrycket ”X1, X2, . . . , Xn är likafördelade” betyder att de stokastiska variab- lernas fördelningar, dvs. att de stokastiska variablernas statistiska egenskaper,

¨ar identiska. Utfallen av variablerna varierar dock.

Sats 5.5 (Tjebysjovs olikhet) F¨or varje ε > 0 g¨aller

P (|X − µ| > ε) ≤ V (X) ε² . (Ers¨atter vi ε med kσ f˚as formuleringen i Blom m.fl.)

Bevis. Detta ¨ar den enda riktigt djupa satsen i kursen som vi kan bevisa.

Njut av elegansen i beviset! Bokens bevis via Markovs olikhet ¨ar egentligen

¨annu elegantare!

Vi n¨ojer oss med det kontinuerliga fallet.

Vi har

V (X) = Z _∞

−∞

(x − µ)²fX(x) dx ≥ Z

|x−µ|>ε

(x − µ)²fX(x) dx

(36)

≥ ε²

|x−µ|>ε

f_X(x) dx = ε²P (|X − µ| > ε).

2

Sats 5.6 Stora talen lag F¨or varje ε > 0 g¨aller

P (|X − µ| > ε) → 0 d˚a n → ∞.

Bevis. Enl. Tjebysjovs olikhet g¨aller

P (|X − µ| > ε) ≤ V (X) ε² = σ²

nε² → ∞

d˚a n → ∞. 2

Diskutera relationen till relativa frekvensers stabilitet.

(37)

F¨ orel¨ asning 6

6.1 Normalf¨ ordelningen

Diskutera mätfel. Ofta beror mätfelen p˚a att att oberoende fel av samma storleksordning adderar sig. Erfarenheten visar att mätfel fördelar sig enl. figur.

Rita!

Vi ska ˚aterkomma till detta i slutet av f¨orel¨asningen.

Standardiserad normalf¨ordelning

Definition 6.1 En s.v. Z s¨ages vara standardiserad normalf¨ordelad om den

är N(0, 1)-fördelad, dvs. om den har täthetsfunktionen ϕ(z) = 1

√2πe^−z²^/2. Dess f¨ordelningsfunktion betecknas med Φ(z), dvs.

Φ(z) = Z _z

−∞

√1

2πe^−x²^/2dx.

Ett problem ¨ar att f¨ordelningsfunktionen inte kan ges p˚a en analytisk form.

Det är dock lätt att numeriskt beräkna fördelningsfunktionen och i praktiken använder man tabeller över Φ(x).

Vi observerar att ϕ(−z) = ϕ(z). Φ(z) ¨ar tabulerad endast f¨or x ≥ 0. Vi har dock

Φ(−z) = Z _−z

−∞

ϕ(x) dx = [y = −x] = − Z _z

∞

ϕ(−y) dy

= Z _∞

z

ϕ(y) dy = 1 − Φ(z).

Om Z ¨ar N(0, 1)-f¨ordelad, s˚a kan man visa att

E(Z) = 0 (ty ϕ(−z) = ϕ(z)) V (Z) = 1.

29

(38)

När vi kommer till statistikdelen behöver vi ofta lösa ekvationer av följande slag:

Best¨am z s˚a att vi f¨or givet α har P (Z ≤ z) = 1 − α;

P (Z > z) = 1 − α;

P (−z < Z ≤ z) = 1 − α.

För att lösa s˚adana ekvationer inför vi α-kvantilen λα definierad av P (Z > λα) = α eller

α = 1 − Φ(λ_α).

Det ¨ar d˚a bra att observera att

1 − α = 1 − Φ(λ_1−α)

⇔ α = Φ(λ1−α)

⇔

α = 1 − Φ(−λ_1−α), vilket ger

λ1−α = −λα. Allm¨an normalf¨ordelning

Definition 6.2 En s.v. X säges vara N(µ, σ)-fördelad, där µ reell och σ > 0, om

Z = X − µ

σ ¨ar N(0, 1)-f¨ordelad.

Sats 6.1 L˚at X vara N(µ, σ)-f¨ordelad. D˚a g¨aller f_X(x) = 1

σϕ

µx − µ σ

¶

= 1

σ√

2πe^−(x−µ)²^/2σ² och

F_X(x) = Φ

µx − µ σ

¶ .

Bevis. Vi har

F_X(x) = P (X ≤ x) = P

µX − µ

σ ≤ x − µ σ

¶

= P µ

Z ≤ x − µ σ

¶

= Φ

µx − µ σ

¶ . Derivation ger f_X(x) = ¹_σϕ¡_x−µ

σ

¢. 2

(39)

6.1. Normalf¨ordelningen 31

Sats 6.2 Om X är N(µ, σ)-fördelad s˚a gäller

E(X) = µ och V (X) = σ². Bevis. Vi ska nu se hur listig v˚ar definition ¨ar!

X = σZ + µ

E(X) = σE(Z) + µ = 0 + µ = µ V (X) = σ²V (Z) + 0 = σ².

2 Sats 6.3 L˚at X vara N(µ, σ)-fördelad och sätt Y = aX + b. D˚a gäller det att

Y ¨ar N(aµ + b, |a|σ)-f¨ordelad.

Bevis. Fr˚an definitionen följer att X = µ + σZ där Z är N(0, 1)-fördelad.

Detta ger

Y = aX + b = a(µ + σZ) + b = aµ + b + aσZ Y − (aµ + b)

aσ = Z.

Om a > 0 f¨oljer satsen. Om a < 0 utnyttjar vi att Z och −Z har samma

f¨ordelning. 2

Sats 6.4 Om X är N(µX, σ_X)-fördelad, Y är N(µY, σ_Y)-fördelad och X och Y är oberoende s˚a gäller att

X + Y ¨ar N µ

µ_X + µ_Y, q

σ_X² + σ²_Y

¶

-f¨ordelad och

X − Y ¨ar N µ

µ_X − µ_Y, q

σ²_X + σ_Y²

¶

-f¨ordelad.

Denna sats tycks inte kunna bevisas p˚a annat s¨att ¨an genom faltning.

Sats 6.5 L˚at X1, . . . , Xnvara oberoende och N(µ1, σ1), . . . , N (µn, σn). D˚a g¨aller att

Xn k=1

ckXk ¨ar N



 Xn k=1

ckµk, vu utXⁿ

k=1

c²_kσ_k²



 -f¨ordelad.

Allmän regel: Linjärkombinationer av oberoende normalfördelade stokastiska variabler är normalfördelade med rätt väntevärde och rätt standardavvikelse.

F¨oljdsats 6.1 L˚at X₁, X₂, . . . , X_n vara oberoende och N(µ, σ)-f¨ordelade s.v.

D˚a g¨aller att

X ¨ar N µ

µ, σ

√n

¶

-f¨ordelad.

(40)

6.2 Centrala gr¨ ansv¨ ardessatsen

Vi har sett n˚agra exempel p˚a att normalfördelningen har trevliga statistiska egenskaper. Detta skulle vi inte ha s˚a stor glädje av, om normalfördelningen inte dessutom var vanligt förekommande. Centrala gränsvärdessatsen CGS, som är den huvudsakliga motiveringen för normalfördelningen, kan utan vidare sägas vara ett av sannolikhetsteorins och statistikens allra viktigaste resultat.

Sats 6.6 (CGS) L˚at X₁, X₂, . . . vara oberoende och lika fördelade s.v. med väntevärde µ och standardavvikelse σ. D˚a gäller att

P µP_n

i=1X_i− nµ σ√

n ≤ x

¶

→ Φ(x) d˚a n → ∞.

Ofta uttrycker man slutsatsen i CGS som att P_n

i=1X_i− nµ σ√

n ¨ar approximativt N(0, 1)-f¨ordelad eller att

Xn i=1

X_i ¨ar approximativt N¡

nµ, σ√ n¢

-f¨ordelad.

En, för statistiken mycket vanlig användning av CGS är följande:

F¨oljdsats 6.2 L˚at X1, X2, . . . vara oberoende och lika fördelade s.v. med väntevärde µ och standardavvikelse σ. D˚a gäller att

P (a < X ≤ b) ≈ Φ

µb − µ σ/√

n

¶

− Φ

µa − µ σ/√

n

¶

om n ¨ar tillr¨ackligt stort.

Det är tyvärr inte möjligt att ge n˚agra generella och enkla tumregler om hur stort n m˚aste vara för att normalapproximationen ska vara användbar. Detta beror p˚a hur ”normalliknande” de enskilda variablerna X_k är. Om Xkna är normalfördelade s˚a ”gäller” ju CGS för alla n. En tumregel är att om Xkna

är n˚agorlunda symmetriskt fördelade s˚a räcker ganska sm˚a n, säg n˚agot tiotal.

Om X_kna är p˚atagligt skevt fördelade s˚a behöver n var n˚agot eller i värsta fall n˚agra hundratal.

Det är sv˚art att formulera strikt, men det räcker i CGS att Xkna är n˚agorlunda oberoende och n˚agorlunda lika fördelade. Med ”n˚agorlunda lika fördelade”

menas framf¨orallt att det inte finns vissa Xk som ¨ar mycket dominerande.

Detta innebär att mätfel i välgjorda försök kan anses vara approximativt nor- malfördelade. I mindre välgjorda försök kan det däremot mycket väl finnas n˚agon dominerande felkälla som inte alls behöver vara approximativt nor- malfördelad.