4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler

(1)

F¨ orel¨ asning 2

4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler

(2)

Stokastiska variabler

Stokastisk variabel (slumpvariabel) (eng: random variable) En variabel vars värde är ett numeriskt utfall av ett slumpmässigt fenomen. Betecknas ofta med stor bokstav X .

(3)

Diskreta variabler

Diskret stokastisk variabel

Stokastisk variabel som har ändligt m˚anga möjliga värden. (Antal av ngt är ett vanligt exempel.)

Varje m¨ojligt utfall har en sannolikhet och summan av dessa sannolikheter ¨ar 1.

null

(4)

Kontinuerliga variabler

Kontinuerlig stokastisk variabel

Stokastisk variabel som kan anta alla v¨arden i ett intervall.

Sannolikhetsf¨ordelningen beskrivs av en t¨athetsfunktion (frekvensfunktion)

Arean under t¨athetsfunktionen ¨ar 1. OBS P(X = a) = 0

(5)

Exempel: Kasta en skruvkork (diskret)

U: Händelsen att öppna sidan är synlig (upp), P(U)=0.7 X = antal g˚anger U inträffar vid tre kast

The probability of any event is the sum of the probabilities pi of the values of X that make up the event.

A bottle cap is tossed three times. We define the random variable X as the number of number of times the cap drops with the open side up.

Value of X 0 1 2 3 Probability .027 .189 .441 .343 What is the probability that at least two

times the cap lands with the open side up ( at least two means two or more )?

P(X ≥ 2) = P(X=2) + P(X=3) = .441 + .343 = 0.784

What is the probability that cap lands with the open side up fewer than three times?

P(X<3) = P(X=0) + P(X=1) + P(X=2) = .027 + .189 + .441 = 0.657 or P(X<3) = 1 – P(X=3) = 1 - 0.343 = 0.657

UDD UUD DUD UDU DDD DDU UUD UUU

(6)

Exempel: V¨ anta p˚ a t˚ agavg˚ ang (kontinuerlig)

X = Hur länge man f˚ar vänta p˚a nästa t˚agavg˚ang d˚a t˚agen avg˚ar 1 g˚ang i timmen ?

P(X < 0.5 or X > 0.8) = P(X < 0.5) + P(X > 0.8) = 1 – P(0.5 < X < 0.8) = 0.7 The probability of a single event is zero:

P(X=1) = (1 – 1)*1 = 0

Intervals

The probability of a single event is meaningless for a continuous random variable. Only intervals can have a non-zero probability, represented by the area under the density curve for that interval.

Height

= 1

X

The probability of an interval is the same whether boundary values are included or excluded:

P(0 ≤ X ≤ 0.5) = (0.5 – 0)*1 = 0.5 P(0 < X < 0.5) = (0.5 – 0)*1 = 0.5 P(0 ≤ X < 0.5) = (0.5 – 0)*1 = 0.5

(7)

Normalf¨ ordelningen

X ∈ N(µ, σ), Z = ^{X −µ}_σ ∈ N(0, 1)

N(0,1)

=>

z

!

x N(64.5, 2.5)

Standardized height (no units)

(8)

Exempel: Kontinuerlig f¨ ordelning

Anta att

P(X ≤ k) =







0, k < 5

k−5

5 , 5 ≤ k ≤ 10 1, k >= 10 a) Vad ¨ar P(X ≤ 7)? Svar: 2/5 d.v.s. 40%

b) Best¨am d s˚a att P(X ≤ d ) = 0.25? Svar: d = 6.25

(9)

Medelv¨ arde / v¨ antev¨ arde f¨ or en stokastisk variabel

Medelvärde / väntevärde

Medelvärdet µtill en variabel är medelvärdet av oändligt m˚anga observationer.

Denna kvantitet benämns ofta väntevärde (expected value), E (X ).

Obs ! Ej samma sak som observerat stickprovsmedelv¨arde

(10)

V¨ antev¨ arde (medelv¨ arde) f¨ or diskret variablel

X ¨ar en diskret variabel med utfallsrummet S = {x1, x2, . . . , x_k} P(X = x_i) = p_i, i = 1, . . . , k

V¨arde p˚a X x1 x2 · · · xk

Sannolikheter p₁ p₂ · · · p_k

µX = E (X ) = p1x1+ p2x2+ · · · + pkxk =

k

X

i =1

pixi

(11)

Exempel: V¨ antev¨ arde vid t¨ arningskast

V¨arde p˚a X 1 2 3 4 5 6

Sannolikheter 1/6 1/6 1/6 1/6 1/6 1/6 µ_X = E (X ) = 1

61 +1 62 +1

63 +1 64 +1

65 +1

66 = 3.5

(12)

Exempel: V¨ antev¨ arde vid lotteri

X ¨ar vinsten (kr) p˚a en lott

V¨arde p˚a X 0 100 1000 Sannolikheter 0.97 0.025 0.005

µ_X = E (X ) = 0.97 ∗ 0 + 0.025 ∗ 100 + 0.005 ∗ 1000 = 7.5

(13)

V¨ antev¨ arde (medel) f¨ or kontinuerlig variabel

Väntevärdet ligger i tyngdpunktenför täthetsfunktionen

(14)

Stora talens lag

Om antalet observationer i ett stickprov växer s˚a närmar sig stickprovets medelvärde, ¯x , sig populationens väntevärde µ.

Detta gäller för alla populationer/fördelningar

(15)

Varians f¨ or stokastiska variabler

X ¨ar en diskret variabel med utfallsrummet S = {x₁, x₂, . . . , x_k} P(X = xi) = pi, i = 1, . . . , k

V¨arde p˚a X x1 x2 · · · x_k Sannolikheter p1 p2 · · · p_k

Variansen ¨ar

σ²_X = p1(x1−µ_X)²+p2(x2−µ_X)²+· · ·+pk(xk−µ_k)²=

k

X

i =1

pi(xi−µ_X)²

Obs ! Ej samma sak som observerat stickprovsvarians Stardardavvikelse

σ_X = q

σ²_X

(16)

Lotter forts..

X ¨ar vinsten (kr) p˚a en lott

V¨arde p˚a X 0 100 1000 Sannolikheter 0.97 0.025 0.005

µ_X = E (X ) = 0.97 ∗ 0 + 0.0025 ∗ 100 + 0.005 ∗ 1000 = 7.5

σ²_X = 0.97 ∗ (0−7.5)²+ 0.0025 ∗ (100−7.5)²+ 0.005 ∗ (1000−7.5)²

≈ 5194, σX =

√

5194 = 72

(17)

R¨ akneregler f¨ or v¨ antev¨ arden och varianser (s. 271)

Om X och Y är stokastiska variabler med korrelation ρ, −1 ≤ ρ ≤ 1, och a och b är konstanter, d˚a gäller:

µ_a+bX = a + bµ_X µ_{X +Y} = µ_X + µ_Y σ²_a+bX = b²σ_X²

σ_{X +Y}² = σ_X² + σ_Y² + 2ρσXσY

σ_{X −Y}² = σ_X² + σ_Y² − 2ρσ_Xσ_Y

(1)