• No results found

Ett statistiskt material kan sammanfattas med medelvärde och standardavvikelse (varians), ̅ och s .

N/A
N/A
Protected

Academic year: 2021

Share "Ett statistiskt material kan sammanfattas med medelvärde och standardavvikelse (varians), ̅ och s ."

Copied!
21
0
0

Loading.... (view fulltext now)

Full text

(1)

Ett statistiskt material kan sammanfattas med medelvärde och standardavvikelse (varians), ̅ och s  .

På liknande sätt kan en sannolikhetsfördelning med kända förutsättningar sammanfattas med väntevärde, µ, och

standardavvikelse, σ.

µ anger vilket medelvärde och

σ anger vilken standardavvikelse man kan förvänta sig att få om mäter många gånger.

Väntevärde, standardavvikelse och varians

(2)

Väntevärde, standardavvikelse och varians

Οm ξ är en diskret stokastisk variabel med utfallsrummet{x i , i = 1,...}.

Väntevärdet för ξ , E[ ξ ], ofta betecknat µ , definieras då som

Variansen för ξ , ofta betecknad σ 2 , definieras som

Standardavvikelsen, ofta betecknad med σ , definieras som

E x P

i

x

i

i

[ ] ξ = ∑ ( ξ = )

2 2

2

2 ] ( ) ( ) ( )

) [(

]

[ ξ = E ξ − µ = ∑ x − µ P ξ = x = E ξ − µ

V

i

i i

σ ξ

ξ ] = ( ) =

[ D

V

(3)

Väntevärde, standardavvikelse och varians

Om ξ är en kontinuerlig stokastisk variabel med frekvensfunktionen f(x). Väntevärdet för ξ , E[ ξ ], ofta betecknad µ , definieras då som

Variansen för ξ , ofta betecknad σ 2 definieras som

Standardavvikelsen, ofta betecknad med σ, definieras som

] [

]

[ ξ ξ

σ = V = D

=

= E [ ξ ] xf ( x ) dx

µ

2 2

2 2

2 [ ξ ] [( ξ µ ) ] ( µ ) ( ) [ ξ ] µ

σ = = − = ∫ − = −

E dx

x f

x E

V

(4)

Median, kvartil och percentil

Den stokastiska variabeln ξ har fördelningsfunktionen F(x).

Medianen definieras som det tal, m, som uppfyller F(m) = 0,5

Den stokastiska variabeln ξ har fördelningsfunktionen F(x). Den p:te percentilen definieras som det tal L p som uppfyller

F(L p ) = p% = (p/100)

Med kvartiler avses Q 1 = L 25 , Q 2 = L 50 (medianen) och Q 3 = L 75 .

p% (100-p)%

f(x)

(5)

ξ diskret stokastisk variabel med utfall  ,  , … ,   och given sannolikhetsfunktion p(x k ).

Med Mathematica beräknas väntevärde och varians enligt.

x={x 1 ,x 2 ,.., x n }

px={p(x 1 ),p(x 2 ),.., p(x n )}

my=x.px (skalärprodukt) varians=x 2 .px-my 2

Väntevärde, standardavvikelse m.m med

Mathematica

(6)

ξ kontinuerlig stokastisk variabel med utfall      och given frekvensfunktion f(x).

Med Mathematica beräknas väntevärde och varians direkt med definitionen

my=     

varians=       -my 2

Väntevärde, standardavvikelse m.m med

Mathematica

(7)

För de ”kända” fördelningarna använder man my=Mean[fördelning]resp.

varians=Variance[fördelning]

median=Median[fördelning]

kvartiler=Quartiles[fördelning]

ex.

Mean[BinomialDistribution[n,p]]

Variance[ExponentialDistribution[λ]]

Median[PoissonDistribution[λ]]

Quartiles[NormalDistribution[µ,σ]]

Väntevärde, standardavvikelse m.m med

Mathematica

(8)

Några vanliga fördelningar

(9)

Oberoende stokastiska variabler

Vi har 2 stokastiska variabler ξ 1 ,och ξ 2

Om P( ξ 1 <x 1 och ξ 2 <x 2 ) = P( ξ 1 <x 1 )P( ξ 2 <x 2 ) för alla tal x 1 och x 2

så sägs ξ 1 och ξ 2 vara oberoende stokastiska variabler.

Jämför: Om A = ( ξ 1 <x 1 ) och B = ( ξ 2 <x 2 ), A och B oberoende händelser gäller

P( ξ 1 <x 1 och ξ 2 <x 2 ) = P(A∩B) = P(A)P(B) =

= P( ξ 1 <x 1 )P( ξ 2 <x 2 )

(10)

Oberoende stokastiska variabler

Vi har n stokastiska variabler ξ 1 , ξ 2 , ..., ξ n

Om

P( ξ 1 <x 1 och ξ 2 <x 2 och ... och ξ n <x n ) =

= P( ξ 1 <x 1 )P( ξ 2 <x 2 ) ... P( ξ n <x n )

för alla tal x 1 , x 2 , ... x n

så är ξ 1 , ξ 2 , ..., ξ n oberoende stokastiska variabler

Sannolikheten för att ξ i <x i påverkar inte sannolikheten för de

övriga.

(11)

Räkneregler för väntevärde och varians för funktioner av stokastiska variabler

nde är oberoe

, ... , n om

n ], n V[

a ...

] V[

a n ]

a ...

V[a

n ] n E[

a ...

] E[

a n n]

a ...

E[a

nde är oberoe

och ], om

V[

] V[

] V[

] E[

] E[

] E[

] V[

a b]

V[a b

] aE[

b]

E[a

ξ ξ

ξ ξ

ξ ξ

ξ ξ

ξ ξ

ξ ξ

ξ ξ

ξ ξ

ξ ξ

ξ ξ

ξ ξ

ξ ξ

1

2 1

2 1 1

1 2

1 1

1 1

2 1

2 1

2 1

2 1

2 1

2

+ +

= +

+

+ +

= +

+

+

= +

+

= +

= +

• +

= +

Sats 5A-C

(12)

Medelvärde av oberoende försök

Vi har n oberoende stokastiska variabler ξ 1 , ξ 2 , ..., ξ n

Alla har samma väntevärde: E[ ξ i ] = µ

Alla har samma varians: V[ ξ i ] = σ 2

Sätt

Då gäller

∑ =

= n

i

ξ i

ξ n

1

1

E [ ] ξ = µ och V [ ] ξ = σ 2 / n

Detta är tillämpligt vid till exempel upprepade mätningar på samma variabel

(13)

Normalfördelningen

Normalfördelningen är vanligt förekommande

– Den bestäms av två parametrar, väntevärde, µ, samt standardavvikelse, σ

f x ( ) = 1 e

− −(x ) /( )

2

2 2

2

σ π

µ σ

F x e

t

dt

x

( ) =

− −( ) /( )

−∞

σ 1 2 π µ

2 2

σ

2

ξ ∈ N ( , ) µ σ

(14)

Normalfördelningen

För normalfördelningen är F(x) omöjlig att beräkna utan numeriska metoder (den går inte att lösa algebraiskt)

Därför finns tabeller för N(0,1), vilken har fördelningsfunktionen

För denna finns tabeller

∫ ∞

= − x

/

t dt

π e

Φ(x)

2

2

2 1

 

 

 Φ  −

=

∈ σ

ξ µ σ

µ

ξ N gäller att P x x

Om ( , ) ( )

Φ(x) x)

Φ( − = 1 −

ξ µ −

∈ N ( , ) 0 1

(15)

Allmänna egenskaper

Sats

Sats

Om ξ œ N( µ , σ ) då är E( ξ )= µ och D( ξ ) = σ.

Dessutom gäller

Y = a ξ + b œ N(a µ + b; |a| σ ) ).

1 , 0 ( blir

och )

, ( Om

N Y

Y N

= −

∈ σ

µ σ ξ

µ

ξ

(16)

Allmänna egenskaper forts.

För alla normalfördelningar gäller:

P( m - σ < ξ < m + σ) = 0.682

P( m -2 σ < ξ < m +2 σ) = 0.954

P( m -3 σ < ξ < m +3 σ) = 0.997

P( m -1.96 σ < ξ < m +1.96 σ) = 0.95

P( m -2.58 σ < ξ < m +2.58 σ) = 0.99

P( m -3.29 σ < ξ < m +3.29 σ) = 0.999

(17)

Fler egenskaper

Sats

Sats

)

;

)

; gäller

oberoende och

, Om

2 2 2

1 2

1 2

1

2 2 2

1 2

1 2

1

2 2 2

1 1 1

( (

σ σ

µ µ

ξ ξ

σ σ

µ µ

ξ ξ

+

+ +

∈ +

N N

)

N(µ ξ

)

N(µ ξ

( n n ) N ( n )

N

c c

N

n i

c N

i

i n

i

i i n

i

i i i

i i

i

/

; och

;

fås med

; gäller

,..., 1 givna,

är och samt

oberoende och

)

; ( Om

n

1 i

n

1

i 1

2 2 1

i

σ µ ξ

σ µ

ξ

µ µ

σ µ

ξ

σ µ ξ

 =

 

∈ 

= ℜ

∑ ∑ ∑

=

= = =

(18)

Centrala gränsvärdessatsen

Vi har n oberoende likafördelade stokastiska variabler

ξ 1 , ξ 2 , ..., ξ n , med väntevärdet µ och standardavvikelsen σ

Om n går mot oändligheten gäller att

Praktiskt: summan av antal slumpvariabler är approximativt normalfördelade om n är stort. (Tumregel n ≥ 30)

Normalapproximationer är mycket användbara

Φ(x) n x

σ

ξ

P

n

i

i

 

 

 

 

∑ −

=1

(19)

och

Oavsett bakomliggande fördelning, bara n är tillräckligt stort, tum regel: n > 30

Följder av centrala gränsvärdessatsen

) n /

, N(

ivt approximat

är att

gäller

Det ξ µ σ

) ,

(

elad normalförd

ivt approximat

är 1

n n

n N

i ξ i µ σ

=

(20)

Följder av centrala gränsvärdessatsen

( )

. 15 )

( :

egel stort tumr

är om

, gäller

så )

(

>

=

λ ξ

λ λ

λ ξ

V n

N ξ

Po Om

( )

. 10 )

1 ( )

( :

tumregel stort,

är om

) 1

( ,

gäller så

) ,

(

>

=

p np

V n

p np

np N

ξ p

n Bin Om

ξ ξ

. 1 10

) 1

( )

( : tumregel stort,

är om

) 1 1

( ,

gäller så

) , , (

 >

 

− −

=

 

 

 

 

− −

N

n p N

np V

n

N

n p N

np np

N ξ

p n N Hyp Om

ξ

ξ

(21)

Approximationsregler - centrala gränsvärdessatsen

Hyp(N, n, p)

Bin(n, p) λ = np Po( λ )

n > 10 p < 0,1

λ = np p+n/N < 0,1

n > 10

n/N < 0,1 N( µ , σ )

np(1-p)>10

λ>15

(N-n)np(1-p) /(N-1)>10

References

Related documents

Redan idag produceras biogas från avfall som räcker till årsför- brukningen för 12 000 bilar.. Hushållens ansträngningar att sortera ut matavfall har alltså

Här finns en stor potential att spara pengar på energiförbrukningen för turistföretag och dessutom bidra till ett mer hållbart samhälle.. ”Som medlem i nätverket Relacs kan man

Bestäm standardavvikelsen för de tre resultaten. Ett visst matteprov skrevs av sju elever. Deras resultat visas i tabellen nedan:.. a) Ange standardavvikelsen för

(Jämför med ett lådagram där endast 5 tal används) Standardavvikelsen beskriver den genomsnittliga  avvikelsen från talens medelvärde..

[r]

Vatten från skärning och tunnel i söder kan ge något ökade flödespulser och eventuellt anläggs fördröjning. Eventuellt anläggs ny kulvert genom

En undersökning i Adelaide visar att 31 % av fotgängarna kände sig osäkra när de delar gångväg med elsparkcyklister (större andel ju äldre fotgängare), och 29 % av

Låt vidare g vara en funktion med