F¨ orel¨ asning 2
4.3 Stokastiska variabler (slumpm¨assiga variabler) 4.4 V¨antev¨arde och varians till stokastiska variabler
Stokastiska variabler
Stokastisk variabel (slumpvariabel) (eng: random variable) En variabel vars v¨arde ¨ar ett numeriskt utfall av ett slumpm¨assigt fenomen. Betecknas ofta med stor bokstav X .
Diskreta variabler
Diskret stokastisk variabel
Stokastisk variabel som har ¨andligt m˚anga m¨ojliga v¨arden. (Antal av ngt ¨ar ett vanligt exempel.)
Varje m¨ojligt utfall har en sannolikhet och summan av dessa sannolikheter ¨ar 1.
null
Kontinuerliga variabler
Kontinuerlig stokastisk variabel
Stokastisk variabel som kan anta alla v¨arden i ett intervall.
Sannolikhetsf¨ordelningen beskrivs av en t¨athetsfunktion (frekvensfunktion)
Arean under t¨athetsfunktionen ¨ar 1. OBS P(X = a) = 0
Exempel: Kasta en skruvkork (diskret)
U: H¨andelsen att ¨oppna sidan ¨ar synlig (upp), P(U)=0.7 X = antal g˚anger U intr¨affar vid tre kast
The probability of any event is the sum of the probabilities pi of the values of X that make up the event.
A bottle cap is tossed three times. We define the random variable X as the number of number of times the cap drops with the open side up.
Value of X 0 1 2 3 Probability .027 .189 .441 .343 What is the probability that at least two
times the cap lands with the open side up ( at least two means two or more )?
P(X ≥ 2) = P(X=2) + P(X=3) = .441 + .343 = 0.784
What is the probability that cap lands with the open side up fewer than three times?
P(X<3) = P(X=0) + P(X=1) + P(X=2) = .027 + .189 + .441 = 0.657 or P(X<3) = 1 – P(X=3) = 1 - 0.343 = 0.657
UDD UUD DUD UDU DDD DDU UUD UUU
Exempel: V¨ anta p˚ a t˚ agavg˚ ang (kontinuerlig)
X = Hur l¨ange man f˚ar v¨anta p˚a n¨asta t˚agavg˚ang d˚a t˚agen avg˚ar 1 g˚ang i timmen ?
P(X < 0.5 or X > 0.8) = P(X < 0.5) + P(X > 0.8) = 1 – P(0.5 < X < 0.8) = 0.7 The probability of a single event is zero:
P(X=1) = (1 – 1)*1 = 0
Intervals
The probability of a single event is meaningless for a continuous random variable. Only intervals can have a non-zero probability, represented by the area under the density curve for that interval.
Height
= 1
X
The probability of an interval is the same whether boundary values are included or excluded:
P(0 ≤ X ≤ 0.5) = (0.5 – 0)*1 = 0.5 P(0 < X < 0.5) = (0.5 – 0)*1 = 0.5 P(0 ≤ X < 0.5) = (0.5 – 0)*1 = 0.5
Normalf¨ ordelningen
X ∈ N(µ, σ), Z = X −µσ ∈ N(0, 1)
N(0,1)
=>
z
!
x N(64.5, 2.5)
Standardized height (no units)
Exempel: Kontinuerlig f¨ ordelning
Anta att
P(X ≤ k) =
0, k < 5
k−5
5 , 5 ≤ k ≤ 10 1, k >= 10 a) Vad ¨ar P(X ≤ 7)? Svar: 2/5 d.v.s. 40%
b) Best¨am d s˚a att P(X ≤ d ) = 0.25? Svar: d = 6.25
Medelv¨ arde / v¨ antev¨ arde f¨ or en stokastisk variabel
Medelv¨arde / v¨antev¨arde
Medelv¨ardet µtill en variabel ¨ar medelv¨ardet av o¨andligt m˚anga observationer.
Denna kvantitet ben¨amns ofta v¨antev¨arde (expected value), E (X ).
Obs ! Ej samma sak som observerat stickprovsmedelv¨arde
V¨ antev¨ arde (medelv¨ arde) f¨ or diskret variablel
X ¨ar en diskret variabel med utfallsrummet S = {x1, x2, . . . , xk} P(X = xi) = pi, i = 1, . . . , k
V¨arde p˚a X x1 x2 · · · xk
Sannolikheter p1 p2 · · · pk
µX = E (X ) = p1x1+ p2x2+ · · · + pkxk =
k
X
i =1
pixi
Exempel: V¨ antev¨ arde vid t¨ arningskast
V¨arde p˚a X 1 2 3 4 5 6
Sannolikheter 1/6 1/6 1/6 1/6 1/6 1/6 µX = E (X ) = 1
61 +1 62 +1
63 +1 64 +1
65 +1
66 = 3.5
Exempel: V¨ antev¨ arde vid lotteri
X ¨ar vinsten (kr) p˚a en lott
V¨arde p˚a X 0 100 1000 Sannolikheter 0.97 0.025 0.005
µX = E (X ) = 0.97 ∗ 0 + 0.025 ∗ 100 + 0.005 ∗ 1000 = 7.5
V¨ antev¨ arde (medel) f¨ or kontinuerlig variabel
V¨antev¨ardet ligger i tyngdpunktenf¨or t¨athetsfunktionen
Stora talens lag
Om antalet observationer i ett stickprov v¨axer s˚a n¨armar sig stickprovets medelv¨arde, ¯x , sig populationens v¨antev¨arde µ.
Detta g¨aller f¨or alla populationer/f¨ordelningar
Varians f¨ or stokastiska variabler
X ¨ar en diskret variabel med utfallsrummet S = {x1, x2, . . . , xk} P(X = xi) = pi, i = 1, . . . , k
V¨arde p˚a X x1 x2 · · · xk Sannolikheter p1 p2 · · · pk
Variansen ¨ar
σ2X = p1(x1−µX)2+p2(x2−µX)2+· · ·+pk(xk−µk)2=
k
X
i =1
pi(xi−µX)2
Obs ! Ej samma sak som observerat stickprovsvarians Stardardavvikelse
σX = q
σ2X
Lotter forts..
X ¨ar vinsten (kr) p˚a en lott
V¨arde p˚a X 0 100 1000 Sannolikheter 0.97 0.025 0.005
µX = E (X ) = 0.97 ∗ 0 + 0.0025 ∗ 100 + 0.005 ∗ 1000 = 7.5
σ2X = 0.97 ∗ (0−7.5)2+ 0.0025 ∗ (100−7.5)2+ 0.005 ∗ (1000−7.5)2
≈ 5194, σX =
√
5194 = 72
R¨ akneregler f¨ or v¨ antev¨ arden och varianser (s. 271)
Om X och Y ¨ar stokastiska variabler med korrelation ρ, −1 ≤ ρ ≤ 1, och a och b ¨ar konstanter, d˚a g¨aller:
µa+bX = a + bµX µX +Y = µX + µY σ2a+bX = b2σX2
σX +Y2 = σX2 + σY2 + 2ρσXσY
σX −Y2 = σX2 + σY2 − 2ρσXσY
(1)