Ett statistiskt material kan sammanfattas med medelvärde och standardavvikelse (varians), ̅ och s .

(1)

Ett statistiskt material kan sammanfattas med medelvärde och standardavvikelse (varians), ̅ och s .

På liknande sätt kan en sannolikhetsfördelning med kända förutsättningar sammanfattas med väntevärde, µ, och

standardavvikelse, σ.

µ anger vilket medelvärde och

σ anger vilken standardavvikelse man kan förvänta sig att få om mäter många gånger.

Väntevärde, standardavvikelse och varians

(2)

Väntevärde, standardavvikelse och varians

Οm ξ är en diskret stokastisk variabel med utfallsrummet{x _i , i = 1,...}.

Väntevärdet för ξ , E[ ξ ], ofta betecknat µ , definieras då som

Variansen för ξ , ofta betecknad σ ² , definieras som

Standardavvikelsen, ofta betecknad med σ , definieras som

E x P

_i

x

_i

i

[ ] ξ = ∑ ( ξ = )

2 2

2 2 ] ( ) ( ) ( )

) [(

]

[ ξ = ^E ξ − µ = ∑ ^x − µ ^P ξ = ^x = ^E ξ − µ

V

i

i i

σ ξ

ξ ] = ( ) =

[ D

V

(3)

Väntevärde, standardavvikelse och varians

Om ξ är en kontinuerlig stokastisk variabel med frekvensfunktionen f(x). Väntevärdet för ξ , E[ ξ ], ofta betecknad µ , definieras då som

Variansen för ξ , ofta betecknad σ ² definieras som

Standardavvikelsen, ofta betecknad med σ, definieras som

] [

]

[ ξ ξ

σ = V = D

∫

∞

−

=

= E [ ξ ] xf ( x ) dx

µ

2 2

2 [ ξ ] [( ξ µ ) ] ( µ ) ( ) [ ξ ] µ

σ = = − = ^∞ ∫ − = −

∞

−

E dx

x f

x E

V

(4)

Median, kvartil och percentil

Den stokastiska variabeln ξ har fördelningsfunktionen F(x).

Medianen definieras som det tal, m, som uppfyller F(m) = 0,5

Den stokastiska variabeln ξ har fördelningsfunktionen F(x). Den p:te percentilen definieras som det tal L _p som uppfyller

F(L _p ) = p% = (p/100)

Med kvartiler avses Q ₁ = L ₂₅ , Q ₂ = L ₅₀ (medianen) och Q ₃ = L ₇₅ .

p% (100-p)%

f(x)

(5)

ξ diskret stokastisk variabel med utfall , , … , och given sannolikhetsfunktion p(x _k ).

Med Mathematica beräknas väntevärde och varians enligt.

x={x ₁ ,x ₂ ,.., x _n }

px={p(x ₁ ),p(x ₂ ),.., p(x _n )}

my=x.px (skalärprodukt) varians=x ² .px-my ²

Väntevärde, standardavvikelse m.m med

Mathematica

(6)

ξ kontinuerlig stokastisk variabel med utfall och given frekvensfunktion f(x).

Med Mathematica beräknas väntevärde och varians direkt med definitionen

my=

varians= -my ²

Väntevärde, standardavvikelse m.m med

Mathematica

(7)

För de ”kända” fördelningarna använder man my=Mean[fördelning]resp.

varians=Variance[fördelning]

median=Median[fördelning]

kvartiler=Quartiles[fördelning]

ex.

Mean[BinomialDistribution[n,p]]

Variance[ExponentialDistribution[λ]]

Median[PoissonDistribution[λ]]

Quartiles[NormalDistribution[µ,σ]]

Väntevärde, standardavvikelse m.m med

Mathematica

(8)

Några vanliga fördelningar

(9)

Oberoende stokastiska variabler

Vi har 2 stokastiska variabler ξ ₁ ,och ξ ₂

Om P( ξ ₁ <x ₁ och ξ ₂ <x ₂ ) = P( ξ ₁ <x ₁ )P( ξ ₂ <x ₂ ) för alla tal x ₁ och x ₂

så sägs ξ ₁ och ξ ₂ vara oberoende stokastiska variabler.

Jämför: Om A = ( ξ ₁ <x ₁ ) och B = ( ξ ₂ <x ₂ ), A och B oberoende händelser gäller

P( ξ ₁ <x ₁ och ξ ₂ <x ₂ ) = P(A∩B) = P(A)P(B) =

= P( ξ ₁ <x ₁ )P( ξ ₂ <x ₂ )

(10)

Oberoende stokastiska variabler

Vi har n stokastiska variabler ξ ₁ , ξ ₂ , ..., ξ _n

Om

P( ξ ₁ <x ₁ och ξ ₂ <x ₂ och ... och ξ _n <x _n ) =

= P( ξ ₁ <x ₁ )P( ξ ₂ <x ₂ ) ... P( ξ _n <x _n )

för alla tal x ₁ , x ₂ , ... x _n

så är ξ ₁ , ξ ₂ , ..., ξ _n oberoende stokastiska variabler

Sannolikheten för att ξ _i <x _i påverkar inte sannolikheten för de

övriga.

(11)

Räkneregler för väntevärde och varians för funktioner av stokastiska variabler

nde är oberoe

, ... , n om

n ], n V[

a ...

] V[

a n ]

a ...

V[a

n ] n E[

a ...

] E[

a n n]

a ...

E[a

nde är oberoe

och ], om

V[

] V[

] E[

] V[

a b]

V[a b

] aE[

b]

E[a

ξ ξ

1 2 1

2 1 1

1 2

1 1

2 1

2 + +

= +

+

• + +

= +

+

• +

= +

• +

= +

• = +

• +

= +

• Sats 5A-C

(12)

Medelvärde av oberoende försök

Vi har n oberoende stokastiska variabler ξ ₁ , ξ ₂ , ..., ξ _n

Alla har samma väntevärde: E[ ξ _i ] = µ

Alla har samma varians: V[ ξ _i ] = σ ²

Sätt

Då gäller

∑ =

= ⁿ

i

ξ i

ξ n

1

1 E [ ] ξ = µ och V [ ] ξ = σ ² / n

Detta är tillämpligt vid till exempel upprepade mätningar på samma variabel

(13)

Normalfördelningen

Normalfördelningen är vanligt förekommande

– Den bestäms av två parametrar, väntevärde, µ, samt standardavvikelse, σ

f x ( ) = 1 e

^{− −}⁽^x ^{) /(} ⁾

2

2 2

2

σ π

µ σ

F x e

^t

dt

x

( ) =

^{− −}⁽ ^{) /(} ⁾

−∞

∫ _σ ¹ ₂ _π ^µ

² ²

^σ

²

ξ ∈ N ( , ) µ σ

(14)

Normalfördelningen

För normalfördelningen är F(x) omöjlig att beräkna utan numeriska metoder (den går inte att lösa algebraiskt)

Därför finns tabeller för N(0,1), vilken har fördelningsfunktionen

För denna finns tabeller

∫ ∞

−

= − x

/

t dt

π e

Φ(x)

²

2 1

 

 

 Φ  −

=

≤

∈ σ

ξ µ σ

µ

ξ N så gäller att P x ^x

Om ( , ) ( )

Φ(x) x)

Φ( − = 1 −

ξ µ −

∈ N ( , ) 0 1

(15)

Allmänna egenskaper

Sats

Om ξ œ N( µ , σ ) då är E( ξ )= µ och D( ξ ) = σ.

Dessutom gäller

Y = a ξ + b œ N(a µ + b; |a| σ ) ).

1 , 0 ( blir

Då

och )

, ( Om

N Y

Y N

∈

= −

∈ σ

µ σ ξ

µ

ξ

(16)

Allmänna egenskaper forts.

För alla normalfördelningar gäller:

P( m - σ < ξ < m + σ) = 0.682

P( m -2 σ < ξ < m +2 σ) = 0.954

P( m -3 σ < ξ < m +3 σ) = 0.997

P( m -1.96 σ < ξ < m +1.96 σ) = 0.95

P( m -2.58 σ < ξ < m +2.58 σ) = 0.99

P( m -3.29 σ < ξ < m +3.29 σ) = 0.999

(17)

Fler egenskaper

Sats

)

;

)

; gäller

oberoende och

, Om

2 2 2

1 2

1

2 2 2

1 2

1

2 2 2

1 1 1

( (

σ σ

µ µ

ξ ξ

σ σ

µ µ

ξ ξ

+

−

∈

−

+ +

∈ +

∈

N N

)

;σ N(µ ξ

)

;σ N(µ ξ

( ⁿ ⁿ ) ^N ( ⁿ )

N

c c

N

n i

c N

i

i n

i

i i n

i

i i i

i i

i

/

; och

;

fås med

; gäller

,..., 1 givna,

är och samt

oberoende och

)

; ( Om

n

1 i

n

1

i 1

2 2 1

i

σ µ ξ

σ µ

ξ

µ µ

σ µ

ξ

σ µ ξ

∈

 =







 



∈ 

= ℜ

∈

∑

∑ ∑ ∑

=

= = =

(18)

Centrala gränsvärdessatsen

Vi har n oberoende likafördelade stokastiska variabler

ξ ₁ , ξ ₂ , ..., ξ _n , med väntevärdet µ och standardavvikelsen σ

Om n går mot oändligheten gäller att

Praktiskt: summan av antal slumpvariabler är approximativt normalfördelade om n är stort. (Tumregel n ≥ 30)

Normalapproximationer är mycket användbara

Φ(x) n x

σ

nµ ξ

P

n

i

→

 





 





≤

∑ −

=1

(19)

och

Oavsett bakomliggande fördelning, bara n är tillräckligt stort, tum regel: n > 30

Ett statistiskt material kan sammanfattas med medelvärde och standardavvikelse (varians), ̅ och s .