Ett statistiskt material kan sammanfattas med medelvärde och standardavvikelse (varians), ̅ och s .
På liknande sätt kan en sannolikhetsfördelning med kända förutsättningar sammanfattas med väntevärde, µ, och
standardavvikelse, σ.
µ anger vilket medelvärde och
σ anger vilken standardavvikelse man kan förvänta sig att få om mäter många gånger.
Väntevärde, standardavvikelse och varians
Väntevärde, standardavvikelse och varians
Οm ξ är en diskret stokastisk variabel med utfallsrummet{x i , i = 1,...}.
Väntevärdet för ξ , E[ ξ ], ofta betecknat µ , definieras då som
Variansen för ξ , ofta betecknad σ 2 , definieras som
Standardavvikelsen, ofta betecknad med σ , definieras som
E x P
ix
ii
[ ] ξ = ∑ ( ξ = )
2 2
2
2 ] ( ) ( ) ( )
) [(
]
[ ξ = E ξ − µ = ∑ x − µ P ξ = x = E ξ − µ
V
i
i i
σ ξ
ξ ] = ( ) =
[ D
V
Väntevärde, standardavvikelse och varians
Om ξ är en kontinuerlig stokastisk variabel med frekvensfunktionen f(x). Väntevärdet för ξ , E[ ξ ], ofta betecknad µ , definieras då som
Variansen för ξ , ofta betecknad σ 2 definieras som
Standardavvikelsen, ofta betecknad med σ, definieras som
] [
]
[ ξ ξ
σ = V = D
∫
∞
∞
−
=
= E [ ξ ] xf ( x ) dx
µ
2 2
2 2
2 [ ξ ] [( ξ µ ) ] ( µ ) ( ) [ ξ ] µ
σ = = − = ∞ ∫ − = −
∞
−
E dx
x f
x E
V
Median, kvartil och percentil
Den stokastiska variabeln ξ har fördelningsfunktionen F(x).
Medianen definieras som det tal, m, som uppfyller F(m) = 0,5
Den stokastiska variabeln ξ har fördelningsfunktionen F(x). Den p:te percentilen definieras som det tal L p som uppfyller
F(L p ) = p% = (p/100)
Med kvartiler avses Q 1 = L 25 , Q 2 = L 50 (medianen) och Q 3 = L 75 .
p% (100-p)%
f(x)
ξ diskret stokastisk variabel med utfall , , … , och given sannolikhetsfunktion p(x k ).
Med Mathematica beräknas väntevärde och varians enligt.
x={x 1 ,x 2 ,.., x n }
px={p(x 1 ),p(x 2 ),.., p(x n )}
my=x.px (skalärprodukt) varians=x 2 .px-my 2
Väntevärde, standardavvikelse m.m med
Mathematica
ξ kontinuerlig stokastisk variabel med utfall och given frekvensfunktion f(x).
Med Mathematica beräknas väntevärde och varians direkt med definitionen
my=
varians= -my 2
Väntevärde, standardavvikelse m.m med
Mathematica
För de ”kända” fördelningarna använder man my=Mean[fördelning]resp.
varians=Variance[fördelning]
median=Median[fördelning]
kvartiler=Quartiles[fördelning]
ex.
Mean[BinomialDistribution[n,p]]
Variance[ExponentialDistribution[λ]]
Median[PoissonDistribution[λ]]
Quartiles[NormalDistribution[µ,σ]]
Väntevärde, standardavvikelse m.m med
Mathematica
Några vanliga fördelningar
Oberoende stokastiska variabler
Vi har 2 stokastiska variabler ξ 1 ,och ξ 2
Om P( ξ 1 <x 1 och ξ 2 <x 2 ) = P( ξ 1 <x 1 )P( ξ 2 <x 2 ) för alla tal x 1 och x 2
så sägs ξ 1 och ξ 2 vara oberoende stokastiska variabler.
Jämför: Om A = ( ξ 1 <x 1 ) och B = ( ξ 2 <x 2 ), A och B oberoende händelser gäller
P( ξ 1 <x 1 och ξ 2 <x 2 ) = P(A∩B) = P(A)P(B) =
= P( ξ 1 <x 1 )P( ξ 2 <x 2 )
Oberoende stokastiska variabler
Vi har n stokastiska variabler ξ 1 , ξ 2 , ..., ξ n
Om
P( ξ 1 <x 1 och ξ 2 <x 2 och ... och ξ n <x n ) =
= P( ξ 1 <x 1 )P( ξ 2 <x 2 ) ... P( ξ n <x n )
för alla tal x 1 , x 2 , ... x n
så är ξ 1 , ξ 2 , ..., ξ n oberoende stokastiska variabler
Sannolikheten för att ξ i <x i påverkar inte sannolikheten för de
övriga.
Räkneregler för väntevärde och varians för funktioner av stokastiska variabler
nde är oberoe
, ... , n om
n ], n V[
a ...
] V[
a n ]
a ...
V[a
n ] n E[
a ...
] E[
a n n]
a ...
E[a
nde är oberoe
och ], om
V[
] V[
] V[
] E[
] E[
] E[
] V[
a b]
V[a b
] aE[
b]
E[a
ξ ξ
ξ ξ
ξ ξ
ξ ξ
ξ ξ
ξ ξ
ξ ξ
ξ ξ
ξ ξ
ξ ξ
ξ ξ
ξ ξ
1
2 1
2 1 1
1 2
1 1
1 1
2 1
2 1
2 1
2 1
2 1
2
+ +
= +
+
•
+ +
= +
+
•
+
= +
•
+
= +
•
= +
• +
= +
•
Sats 5A-C
Medelvärde av oberoende försök
Vi har n oberoende stokastiska variabler ξ 1 , ξ 2 , ..., ξ n
Alla har samma väntevärde: E[ ξ i ] = µ
Alla har samma varians: V[ ξ i ] = σ 2
Sätt
Då gäller
∑ =
= n
i
ξ i
ξ n
1
1
E [ ] ξ = µ och V [ ] ξ = σ 2 / n
Detta är tillämpligt vid till exempel upprepade mätningar på samma variabel
Normalfördelningen
Normalfördelningen är vanligt förekommande
– Den bestäms av två parametrar, väntevärde, µ, samt standardavvikelse, σ
f x ( ) = 1 e
− −(x ) /( )2
2 2
2
σ π
µ σ
F x e
tdt
x
( ) =
− −( ) /( )−∞
∫ σ 1 2 π µ
2 2σ
2ξ ∈ N ( , ) µ σ
Normalfördelningen
För normalfördelningen är F(x) omöjlig att beräkna utan numeriska metoder (den går inte att lösa algebraiskt)
Därför finns tabeller för N(0,1), vilken har fördelningsfunktionen
För denna finns tabeller
∫ ∞
−
= − x
/
t dt
π e
Φ(x)
22
2 1
Φ −
=
≤
∈ σ
ξ µ σ
µ
ξ N så gäller att P x x
Om ( , ) ( )
Φ(x) x)
Φ( − = 1 −
ξ µ −
∈ N ( , ) 0 1
Allmänna egenskaper
Sats
Sats
Om ξ œ N( µ , σ ) då är E( ξ )= µ och D( ξ ) = σ.
Dessutom gäller
Y = a ξ + b œ N(a µ + b; |a| σ ) ).
1 , 0 ( blir
Då
och )
, ( Om
N Y
Y N
∈
= −
∈ σ
µ σ ξ
µ
ξ
Allmänna egenskaper forts.
För alla normalfördelningar gäller:
P( m - σ < ξ < m + σ) = 0.682
P( m -2 σ < ξ < m +2 σ) = 0.954
P( m -3 σ < ξ < m +3 σ) = 0.997
P( m -1.96 σ < ξ < m +1.96 σ) = 0.95
P( m -2.58 σ < ξ < m +2.58 σ) = 0.99
P( m -3.29 σ < ξ < m +3.29 σ) = 0.999
Fler egenskaper
Sats
Sats
)
;
)
; gäller
oberoende och
, Om
2 2 2
1 2
1 2
1
2 2 2
1 2
1 2
1
2 2 2
1 1 1
( (
σ σ
µ µ
ξ ξ
σ σ
µ µ
ξ ξ
+
−
∈
−
+ +
∈ +
∈
∈
N N
)
;σ N(µ ξ
)
;σ N(µ ξ
( n n ) N ( n )
N
c c
N
n i
c N
i
i n
i
i i n
i
i i i
i i
i
/
; och
;
fås med
; gäller
,..., 1 givna,
är och samt
oberoende och
)
; ( Om
n
1 i
n
1
i 1
2 2 1
i
σ µ ξ
σ µ
ξ
µ µ
σ µ
ξ
σ µ ξ
∈
∈
=
∈
= ℜ
∈
∈
∑
∑ ∑ ∑
=
= = =
Centrala gränsvärdessatsen
Vi har n oberoende likafördelade stokastiska variabler
ξ 1 , ξ 2 , ..., ξ n , med väntevärdet µ och standardavvikelsen σ
Om n går mot oändligheten gäller att
Praktiskt: summan av antal slumpvariabler är approximativt normalfördelade om n är stort. (Tumregel n ≥ 30)
Normalapproximationer är mycket användbara
Φ(x) n x
σ
nµ ξ
P
n
i
i
→
≤
∑ −
=1