Tentamen TEN1, HF1012, 4 juni 2014
Matematisk statistik Kurskod HF1012
Skrivtid: 8:15-12:15
Lärare och examinator : Armin Halilovic
Hjälpmedel: Bifogat formelhäfte ("Formler och tabeller i statistik ") och miniräknare av vilken typ som helst.
Skriv namn och personnummer på varje blad.
Denna tentamenslapp får ej behållas efter tentamenstillfället utan ska lämnas in tillsammans med lösningar.
Poängfördelning och betygsgränser: Tentamen ger maximalt 32 poäng.
Betygsgränser: För betyg A, B, C, D, E krävs 30, 24, 20, 16 respektive 12 poäng.
Komplettering: 11 poäng på tentamen ger rätt till komplettering (betyg Fx) . Vem som har rätt till komplettering framgår av betyget Fx på MINA SIDOR.
Komplettering sker c:a två veckor efter att tentamen är rättad. Om komplettering är godkänd rapporteras betyg E, annars rapporteras F.
Uppgift 1. (3p) Bara för dem som inte klarat ks1.
För de två händelserna A och B gäller att P(A) = 0.7 P(A∪ B)=0.9 och P(B) = 0.4 Rita mängddiagram och bestäm
a) )P(A∩B . b) P(Ac∩B).
c) Bestäm (med angivande av motivering) om A och B är oberoende händelser.
Uppgift 2. (3p) Bara för dem som inte klarat ks2.
En kontinuerlig stokastisk variabel X har täthetsfunktionen
⎩ ⎨
⎧ ≤ ≤
= 0 förövrigt.
1 x 0 om ) 5
(
x
4x f
Bestäm a) väntevärdet b) variansen till den s.v. X.
Uppgift 3. (3p) Bara för dem som inte klarat ks3.
Vid tillverkning av en viss typ motstånd blir resistansen N(10,2) fördelad. (Enhet ohm).
Vad är sannolikheten att 5 seriekopplade sådana motstånd skall få en resistans mellan 48 och 53 ohm?
===================================================
Uppgift 4. (2p) I en låda finns 100 röda 200 gröna och 300 blå kulor.
Vi tar 50 kulor på måfå. Bestäm sannolikheten att få a) (exakt) 13 röda, 17 gröna och 20 blå kulor b) högst 2 röda kulor ( bland 50 valda) Du ska svara med binomialkoefficienter.
Uppgift 5. (2p)
En stokastisk variabel X har fördelningsfunktionen
⎩ ⎨
⎧
<
∞
<
≤
= −
−0 , 0
0 ) ,
(
2
x x e
x c F
x
a) Visa att parametern c har värdet 1.
b) Beräkna medianen till X.
Uppgift 6. (3p) Låt X1∈N(20,2) och X2∈N(15,3) vara normalfördelade s.v.
Låt Y =2X1−X2. Bestäm ett tal b så att P(Y > b)=0.15. Var god vänd!
Uppgift 7. (4p)
En forskare gjorde 5 mätningar för en normalfördelade stokastisk variabel X ∈N(μ,σ) och fick följande resultat (σ okänt):
X: 33 32 28 31 26
Bestäm ett 95 % konfidensintervall för medelvärdet μ.
Uppgift 8. (2p)
a) Bestäm en stationär sannolikhetsvektor för en Markovkedja i diskret tid vars
övergångsmatris är ⎥⎦
⎢ ⎤
⎣
=⎡
6 . 0 4 . 0
5 . 0 5 .
P 0 .
b) Bestäm en stationär sannolikhetsvektor för en Markovkedja i kontinuerlig tid vars
intensitetsmatris är ⎥
⎦
⎢ ⎤
⎣
⎡
−
= −
3 3
4
Q 4 .
Uppgift 9. (3p)
En kontinuerlig Markovkedja med två tillstånd E1 och E2 har intensitetsmatrisen
⎥⎦
⎢ ⎤
⎣
⎡
−
= −
16 16
4
Q 4 . Låt pr(t)=(x(t),y(t))vara tillhörande sannolikhetsvektor där x(t) betecknar sannolikheten att systemet är tillstånd E1 och y(t) sannolikheten för E2 vid tiden t. Vid tiden 0 är systemet i tillstånd E1 dvs pr(0)=(1,0).
Bestäm den transienta sannolikhetsvektorn pr(t)=(x(t),y(t)), d.v.s. lös systemet Q
t p t
pr′( )= r( ) . Uppgift 10. (2p)
Låt X vara en kontinuerlig s.v. Bevisa att E(aX+b)=aE(X)+b, där a och b är
konstanter. ( Här E(X) och E(aX+b) betecknar väntevärdet av X respektive aX+b) Uppgift 11. (3p)
I en stad lider 1 % av befolkningen av en sjukdom. Man har tagit fram ett billigt test som visar positivt utslag för 99 % av patienterna som har sjukdomen, men som även visar falskt positivt resultat för 2 % av dem som inte har sjukdomen. Om en person får positivt resultat i testet, hur stor är då risken att hon/han har sjukdomen?
Uppgift 12. (2p) Vi placerar 13 identiska bollar i 5 stora lådor A, B, C D och E . Ett exempel på placering:
a) På hur många olika sätt kan man göra det?
b) I hur många placeringar är båda lådor B och D tomma?
Lycka till.
FACIT
Uppgift 1. (3p) Bara för dem som inte klarat ks1.
För de två händelserna A och B gäller att P(A) = 0.7 P(A∪ B)=0.9 och P(B) = 0.4 Rita mängddiagram och bestäm
a) P(A∩B). b) P(Ac∩B).
c) Bestäm (med angivande av motivering) om A och B är oberoende händelser.
Lösning:
a)
2 . 0 ) (
) (
4 . 0 7 . 0 9 . 0 ) ( ) ( ) ( )
(A∪B =P A +P B −P A∩B ⇒ = + −P A∩B ⇒P A∩B = P
b) P(Ac∩B)=P(B)−P(A∩B)=0.2
c) A och B är oberoende händelser om och endast om P(A∩B)=P(A)⋅P(B). I vårt fall gäller:
2 . 0 ) (A∩ B =
P , medan P(A)⋅ BP( )=0.28.
Slutsats: A och B är INTE oberoende händelser eftersom )
( ) ( )
(A B P A P B
P ∩ ≠ ⋅ .
Svar: a) P(A∩ B)=0.2 b) P(Ac∩ B)=0.2 c) EJ oberoende.
Uppgift 2. (3p) Bara för dem som inte klarat ks2.
En kontinuerlig stokastisk variabel X har täthetsfunktionen Bc
A∩
B A∩
B Ac∩
⎩ ⎨
⎧ ≤ ≤
= 0 förövrigt.
1 x 0 om ) 5
(
x
4x f
Bestäm a) väntevärdet b) variansen till den s.v. X.
Lösning:
a) Väntevärdet är
∫
∞∞
−
=
= xf x dx
m ( )
6 5 5 6
5
1
0 1 6
0
5 ⎥ =
⎦
⎢ ⎤
⎣
=⎡
∫
x dx xb) Variansen är
∫
∞∞
−
− 2
2f(x)dx m x
Först
∫
∞∞
−
dx x f
x2 ( ) =
7 5 5 7
5
1
0 1 7
0
6 ⎥ =
⎦
⎢ ⎤
⎣
=⎡
∫
x dx xDärför är variansen= 0.01984
252 5 36 25 7 5 6 5 7
5 2
≈
=
−
=
⎟⎠
⎜ ⎞
⎝
−⎛ Svar. a) 5/7 b) 5/252
Uppgift 3. (3p) Bara för dem som inte klarat ks3.
Vid tillverkning av en viss typ motstånd blir resistansen N(10,2) fördelad. (Enhet ohm).
Vad är sannolikheten att 5 seriekopplade sådana motstånd skall få en resistans mellan 48 och 53 ohm?
Lösning:
Låt Xkbeteckna resistansen i motstånd k och Y den totalaresistansen i 5 seriekopplade sådana motstånd. Då gäller
Y = X
1+ X
2+ L + X
5. Vidare50 10 10 10 10 10 10 ) ( )
( ) ( )
( Y = E X
1+ E X
2+ + E X
5= + + + + + =
E L
20 4 4 4 4 4 1
1 )
(Y = 2σ12 +L 2σ52 = + + + + = Var
Därmed blir standardavvikelsen D(Y)= 20 =2 5. Alltså Y∈N(50,2 5)
( Samma resultat för vi direkt med hjälp av formel Y∈N(nm,σ n))
Nu har vi )
5 2
50 (48 5 )
2 50 (53 ) 48 ( ) 53 ( ) 53 48
( <Y < =F −F =Φ − −Φ −
P
42 . 0 3264 0 7486 0 0.45) ( 0.67)
( −Φ − = − ≈
Φ
= . .
Svar. 0.42
Uppgift 4. (2p) I en låda finns 100 röda 200 gröna och 300 blå kulor.
Vi tar 50 kulor på måfå. Bestäm sannolikheten att få a) (exakt) 13 röda, 17 gröna och 20 blå kulor b) högst 2 röda kulor ( bland 50 valda) Du ska svara med binomialkoefficienter.
Svar a)
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛
⎟⎟⎠
⎜⎜ ⎞
⎝
⋅⎛
⎟⎟⎠
⎜⎜ ⎞
⎝
⋅⎛
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛
50 600
20 300 17
200 13
100
L ösning b)
Det finns 100 röda och 500 "icke röda" kulor.
P(högst 2 röda kolor)= P(0 röd)+P( 1 röd)+ P(2 röda)
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛
⎟⎟⎠
⎜⎜ ⎞
⎝
⋅⎛
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛ +
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛
⎟⎟⎠
⎜⎜ ⎞
⎝
⋅⎛
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛ +
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛
⎟⎟⎠
⎜⎜ ⎞
⎝
⋅⎛
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛
=
50 600
48 500 2
100
50 600
49 500 1
100
50 600
50 500 0
100
.
Svar b)
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛
⎟⎟⎠
⎜⎜ ⎞
⎝
⋅⎛
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛ +
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛
⎟⎟⎠
⎜⎜ ⎞
⎝
⋅⎛
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛ +
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛
⎟⎟⎠
⎜⎜ ⎞
⎝
⋅⎛
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛
50 600
48 500 2
100
50 600
49 500 1
100
50 600
50 500 0
100
Uppgift 5. (2p)
En stokastisk variabel X har fördelningsfunktionen
⎩ ⎨
⎧
<
∞
<
≤
= −
−0 , 0
0 ) ,
(
2
x x e
x c F
x
a) Visa att parametern c har värdet 1.
b) Beräkna medianen till X.
Lösning a)
Metod 1. För en fördelningsfunktion alltid gäller lim ( )=1
∞
→ F x
x . Därfö
1 1
0 1
) (
lim − − 2 = ⇔ − = ⇔ =
∞
→ c e x c c
x .
Metod 2. Enligt antagande är F(x) kontinuerlig. Det betyder att vänstergränsvärdet=
högergränsvärdet = funktionens värde i varje punkt x, därmed även i punkten x=0.
Därför lim ( ) lim ( )
0
0 F x F x
x
x→ + = → −
Eftersom lim ( ) lim( ) 0 1
0 0
2 = − = −
−
= −
+
→ +
→ F x c e x c e c
x x
och lim ( ) lim0 0
0
0 = =
−
→
−
→ x
x F x
har vi c−1=0⇒c=1. Lösning b)
) 2 / 1 ln(
) 2 / 1 ln(
2 / 1 2
/ 1 1
2 / 1 )
(x = ⇒ −e− 2 = ⇒e− 2 = ⇒−x2 = ⇒x2 =−
F x x
dvs x2 =ln(2)⇒x= ln(2)
Svar b) Medianen= ln2 ≈ 0.8325546
Uppgift 6. (3p) Låt X1∈N(20,2) och X2∈N(15,3) vara normalfördelade s.v.
Låt Y =2X1−X2. Bestäm ett tal b så att P(Y > b)=0.15. Lösning:
Väntevärdet: E(Y)=2E(X1)−E(X2 )=2⋅20−15=25
Variansen: Var(Y)=22σ12+(−1)2σ22 =22⋅22 +(−1)2⋅32 =16+9=25 Standardavikelsen: D(Y)= Var =5
Därmed Y∈N(25,5).
För att bestämma b noterar vi att P(Y > b)=0.15 är ekvivalent med 85
. 0 ) (Y ≤ b =
P dvs F(b)=0.85. Nu har vi
18 . 30 1.0364 5
25 1.0364
5 85 25
. 0 5 )
( 25 85
. 0 )
( = ⇒Φ b− = ⇒b− = ⇒b= + ⋅ =
b F
Svar. b=30.18 Uppgift 7. (4p)
En forskare gjorde 5 mätningar för en normalfördelade stokastisk variabel X ∈N(μ,σ) och fick följande resultat (σ okänt):
X: 33 32 28 31 26
Bestäm ett 95 % konfidensintervall för medelvärdet μ.
Lösning.
Medelvärdet:
∑
=
= n
i
xi
x n
1
1 =30 .
Variansen:
∑
=
− −
=
= n
i
i x
n x Var
1
2
2 ( )
1
σ 1 =8.5.
= Var
σ =2.9154759
=
= 0.025 2
/ t
tα F-1(0.975)=2.7764 Konfidensintervall:
) ,
( /2 /2
t n n x
t
x
σ σ
α
α +
− = )
5 2.915 2.7764
30 5 ,
2.915 2.7764
30
( − ⋅ + ⋅
=(26.3799, 33.6200) Svar. (26.3799, 33.6200) Uppgift 8. (2p)
a) Bestäm en stationär sannolikhetsvektor för en Markovkedja i diskret tid vars
övergångsmatris är ⎥
⎦
⎢ ⎤
⎣
=⎡
6 . 0 4 . 0
5 . 0 5 .
P 0 .
b) Bestäm en stationär sannolikhetsvektor för en Markovkedja i kontinuerlig tid vars
intensitetsmatris är ⎥
⎦
⎢ ⎤
⎣
⎡
−
= −
3 3
4
Q 4 .
Lösning.
a)För att bestämma en stationär sannolikhetsvektor för en diskret Markovkedja löser vi ekvationen pr = . I vårt fall, med prP pr =( yx, ) har vi
⎥⎦
⎢ ⎤
⎣
= ⎡
6 . 0 4 . 0
5 . 0 5 . ) 0 , ( ) ,
(x y x y .
Härav x=0.5x+0.4y (ekv1) y=0.5x+0.6y (ekv2)
eller efter förenkling : 0.5x−0.4y=0 (ekv1) −0.5x+0.4y=0 (ekv2)
Dessutom gäller x+ y =1 (ekv3) (eftersom pr =( yx, )är en sannolikhetsvektor).
Från ekv 3 får vi y=1−x. Detta substitueras i ekv1 och fås
0 ) 1 ( 4 . 0 5 .
0 x− −x = ⇒0.9x+0.4=0⇒ 9
= 4 x .
Därefter
9 1− =5
= x
y .
Svar a) )
9 ,5 9 (4
= pr
b) För att bestämma en stationär sannolikhetsvektor för en kontinuerlig Markovkedja löser vi ekvationen pr =Q 0r. I vårt fall, med pr =( yx, ) har vi
) 0 , 0 3 ( 3
4 ) 4
,
( ⎥=
⎦
⎢ ⎤
⎣
⎡
− y −
x får vi två ekvationer
−4x+3y=0 (ekv1) 4x− y3 =0 (ekv2) dessutom gäller
x+ y =1 (ekv3) (normeringsekvation för en sannolikhetsvektor) Från ekv 3 får vi y=1−x. Detta substitueras i ekv1 och fås
0 ) 1 ( 3
4 + − =
− x x ⇒− x7 +3=0⇒ 7
= 3 x .
Därefter
7 1− = 4
= x
y .
Svar b) )
7 ,4 7 (3
= pr
Uppgift 9. (3p)
En kontinuerlig Markovkedja med två tillstånd E1 och E2 har intensitetsmatrisen
⎥⎦
⎢ ⎤
⎣
⎡
−
= −
16 16
4
Q 4 . Låt pr(t)=(x(t),y(t))vara tillhörande sannolikhetsvektor där x(t)
betecknar sannolikheten att systemet är tillstånd E1 och y(t) sannolikheten för E2 vid tiden t.
Vid tiden 0 är systemet i tillstånd E1 dvs pr(0)=(1,0).
Bestäm den transienta sannolikhetsvektorn pr(t)=(x(t),y(t)), d.v.s. lös systemet
Q t p t
pr′( )= r( ) . Lösning:
⎥⎦
⎢ ⎤
⎣
⎡
−
= −
16 16
4 Q 4
Vi substituerar pr(t)=(x(t),y(t))
i ekvationen pr′(t)= pr(t)Qoch får
⎥⇒
⎦
⎢ ⎤
⎣
⎡
−
= −
16 16
4 )) 4
( ), ( ( )) ( ' ), ( '
(x t y t x t y t
) ( 16 ) ( 4 ) (
' t x t y t
x =− + (ekv a) )
( 16 ) ( 4 ) (
' t x t y t
y = − (ekv b)
samt
1 ) ( )
(t + ty =
x ( ekv c)
(ekv c gäller eftersom (x(t),y(t)) är en sannolikhetsvektor.) Från ekv c får vi
) ( 1 )
(t x t y = −
som vi substituerar i (ekv a) för att få en differencial ekvation med 1 obekant funktion x(t):
)) ( 1 ( 16 ) ( 4 ) (
' t x t x t
x =− + −
Efter förenkling har vi följande ekvation med konstanta koefficienter:
16 ) ( 20 ) (
' t + x t =
x (*)
Motsvarande karakteristiska ekvationen till homogena delen är 20
0
20= ⇒ =−
+ r
r
och därmed är
t
h Ce
X = −20 den allmänna lösningen till det homogena delen.
En partikulär lösning får vi med hjälp av ansatsen A
Xp = ( eftersom högerledet i (*) är 12, dvs en konstant) Substitutionen av Xp =A i (*) gör
5 / 4 20 / 16 16
20
0+ A= ⇐A= =
Alltså Xp =4/5
Därför x(t)= Xh +Xp =Ce− t20 +4/5
Begynnelsevillkoret: Enligt antagande är systemet i funktion vid t=0.
Därför x(0)=1. Alltså Ce0t +4/5=1⇒C=1/5 och
5 4 5
) 1
(t = e− t20 + x
För att få y(t) använder vi y(t)=1−x(t) och får
t
t e
e t
y 20 20
5 1 5 ) 1 5 4 5
(1 1 )
( = − − + = − −
Svar. ⎟
⎠
⎜ ⎞
⎝
⎛ + −
=
= x t y t e− t e− t
p 20 20
5 1 5 , 1 5 4 5
)) 1 ( ), ( r (
Uppgift 10. (2p)
Låt X vara en kontinuerlig s.v. Bevisa att E(aX+b)=aE(X)+b, där a och b är
konstanter. ( Här E(X) och E(aX+b) betecknar väntevärdet av X respektive aX+b) Lösning:
Enligt definitionen har vi
E(aX+b)=
∫ ∫
∞[ ]
∞
−
∞
∞
−
= +
=
+b f x dx axf x bf x dx
ax ) ( ) ( ) ( )
(
∫ ∫
∞
∞
−
∞
∞
−
= +b f x dx dx
x xf
a ( ) ( ) aE(X)+ b⋅1 V.S.B
Anmärkning: Vi har använt att
∫
∞xf(x)dx E(X)∞
−
= och att
∫
∞ ( ) 1∞
−
= dx x
f .
Uppgift 11. (3p)
I en stad lider 1 % av befolkningen av en sjukdom. Man har tagit fram ett billigt test som visar positivt utslag för 99 % av patienterna som har sjukdomen, men som även visar falskt positivt resultat för 2 % av dem som inte har sjukdomen. Om en person får positivt resultat i testet, hur stor är då risken att hon/han har sjukdomen?
Lösning:
Låt S vara händelsen att en ( slumpvis vald) person är sjuk.
Låt F vara händelsen att en ( slumpvis vald) person är frisk.
Låt Pos vara händelsen att testet ger positivt utslag .
Låt Neg vara händelsen att testet ger negativt utslag .
Enligt uppgiften har vi följande:
Då gäller ( enligt formeln för betingade sannolikhet):
) (
) ) (
|
( P Pos
Pos S Pos P
S
P = ∩ .
Den totala sannolikheten för positivt utslag är
=
⋅ +
⋅
= ( ) ( | ) ( ) ( | )
)
(Pos P S P Pos S P F P Pos F P
0.0297 02
. 0 99 . 0 99 . 0 01 .
0 ⋅ + ⋅ =
Härav 0.33333
3 1 0297 . 0
99 . 0 01 . 0 )
(
)
| ( ) ( )
( ) ) (
|
( = ∩ = ⋅ = ⋅ = ≈
Pos P
S Pos P S P Pos
P Pos S Pos P
S
P
Svar. 0.33
Uppgift 12. (2p) Vi placerar 13 identiska bollar i 5 stora lådor A, B, C D och E . Ett exempel på placering:
a) På hur många olika sätt kan man göra det?
b) I hur många placeringar är båda lådor B och D tomma?
Lösning:
a)
Vi betraktar ett ekvivalent problem:
en person
sjuk 0.01
positivt utslag 0.99
negativt utslag 0.01
frisk 0.99
positivt utslag 0.02
negativt utslag 0.98
Permutationer av 6 bokstäver I och 13 bokstäver O (se bilden).
T ex: Permutationen IOOIOOOOIIOOOI svarar mot ovanstående exempel.
Varje permutation måste börja och sluta med I (annars hamnar inte bollen i någon låda) Därför ”permuterar” vi 4 bokstäver I och 13 bokstäver O.
a) Det finns 2380
1 2 3 4
14 15 16 17
! 13
! 4
!
17 =
⋅
⋅
⋅
⋅
⋅
= ⋅
= ⋅
N sådana permutationer.
Svar a) 2380 b)
Om 2 lådor är tomma placerar vi alla 13 bollar i 3 lådor . (Varje permutation måste börja och sluta med I). Vi resonerar på samma sätt som i a-delen:
Det finns 105
2 14 15
! 13
! 2
!
15 = ⋅ =
= ⋅
K sådana permutationer.
Svar b) 105