Po¨ang totalt f¨or del 1: 25 (12 uppgifter) Tentamensdatum 2012-06-02 Po¨ang totalt f¨or del 2: 30 (3 uppgifter) Skrivtid 09.00 – 14.00 L¨arare: Adam Jonsson och Ove Edlund
Jourhavande l¨arare: Adam Jonsson Tel: 0920-491948
Till˚atna hj¨alpmedel: • R¨aknedosa,
• Kursboken V¨annman: Matematisk statistik. I kursboken f˚ar anteckningar och post-it lappar finnas, men inte l¨osta exempel.
• Kompendium om flerdimensionella f¨ordelningar
• Formelblad
• Tabeller
Tentamen best˚ar av tv˚a delar. P˚a den f¨orsta delen, som ¨ar obligatorisk f¨or att kunna bli godk¨and, ska enbart svar l¨amnas in, men l¨osningar f˚ar bifogas. Observera dock att dessa ej kommer att bed¨omas utan enbart anv¨andas vid gr¨ansfall f¨or att avg¨ora om n˚agon uppgift kan ”r¨attas upp” p˚a grund av slarvfel. P˚a del 1 ges inga delpo¨ang p˚a uppgifterna.
Svaren f¨or del 1 ska fyllas i p˚a det blad som bifogas tentamen. Detta blad m˚aste l¨amnas in. L¨agg detta blad f¨orst bland l¨osningarna. Om inte det ifyllda svarsbladet har l¨amnats in s˚a bed¨oms tentamen som underk¨and. F¨or godk¨ant kr¨avs minst 17 po¨ang p˚a del 1. Med 2 extrapo¨ang fr˚an laborationerna och KGB s˚a r¨acker det allts˚a med 15 po¨ang av de 25 m¨ojliga f¨or godk¨ant.
P˚a den andra delen, som g¨aller tentamen f¨or ¨overbetyg, ska fullst¨andiga l¨osningar l¨amnas in. T¨ank p˚a att redovisa dina l¨osningar p˚a ett klart och tydligt s¨att och motivera resonemangen. Vid bed¨omningen av l¨osningarna l¨aggs stor vikt vid hur l¨osningarna ¨ar motiverade och redovisade. F¨or betyg 4 kr¨avs godk¨ant p˚a den f¨orsta obligatoriska delen samt minst 13 po¨ang fr˚an den andra delen f¨or ¨overbetyg. F¨or betyg 5 kr¨avs godk¨ant p˚a den f¨orsta obligatoriska delen samt minst 23 po¨ang fr˚an den andra delen f¨or ¨overbetyg.
OBS! Det g˚ar inte att kompensera underk¨ant p˚a den f¨orsta korta delen av tentamen med po¨ang p˚a den andra delen.
Ange p˚a tentamensomslaget om du har l¨amnat in l¨osningar p˚a del 2 genom att kryssa f¨or de sista tre uppgifterna.
Om du plussar f¨or ¨overbetyg s˚a skriv detta p˚a tentamensomslaget.
LYCKA TILL!
1. Antag att 6 % av alla bilf¨orare k¨or berusat. Antag ocks˚a att sanno- likheten att en berusad person somnar under bilk¨orningen ¨ar 0.26 och att motsvarande sannolikhet f¨or en nykter person ¨ar 0.01. En olycka intr¨affar, och det konstateras att bilf¨oraren somnat vid ratten. Vad ¨ar
sannolikheten att f¨oraren var berusad? (2p)
2. Antag att du har ett stickprov av storlek 8 fr˚an en kontinuerlig f¨ordelning och att medianen i f¨ordelningen ¨ar lika med 6.5. Ber¨akna sannolikhe- ten att h¨ogst 4 av stickprovsvariablerna antar ett v¨arde som ¨ar st¨orre
¨an 6.5. (3p)
3. I en beh˚allare finns 15 atomk¨arnor som efter en slumpm¨assig tid f¨orintas genom s.k. alfas¨onderfall, d¨ar en atomk¨arna s¨onderfaller och avger en alfapartikel. Den f¨orv¨antade tiden till s¨onderfall ¨ar lika med 3 sekunder.
Att tiden f¨or s¨onderfallet ¨ar Exponentialf¨ordelad kan delvis f¨orklaras med att atom¨ara partiklar inte ˚aldras.
Ber¨akna sannolikheten att det tar mindre ¨an 1 sekund f¨or antalet
atomk¨arnor att reduceras till 14. (2p)
4. Betrakta funktionen f (x) =
(ax + b om 0 ≤ x ≤ 1, 0 annars,
d¨ar a och b ¨ar konstanter. Det finns flera v¨arden p˚a a och b f¨or vilka f ¨ar en frekvensfunktion, men endast ett par av v¨arden som g¨or att v¨antev¨ardet i f¨ordelningen ¨ar lika med 1/3. Vilka ¨ar dessa v¨arden? (2p) 5. Thomas tar sp˚arvagnen till jobbet varje morgon. V¨antetiden i minuter
kan betrakas som en slumpvariabel med R(0, 10)-f¨ordelning. V¨al p˚a jobbet m˚aste Thomas v¨anta en Exp(1)-f¨ordelad tid p˚a att hans dator ska starta. Ber¨akna v¨antev¨arde och varians f¨or den totala tid som
Thomas v¨antar varje morgon. (2p)
6. Livsl¨angden (enhet: timmar) f¨or en viss typ av elektronr¨or ¨ar exponen- tialf¨ordelad med λ = 0.005. Ett s˚adan r¨or ing˚ar i en radarutrustning p˚a ett fartyg, d¨ar man i ett lager under d¨ack har 100 elektronr¨or. N¨ar ett elektronr¨or g˚ar s¨onder byts det genast ut.
Ber¨akna en tid T s˚adan att lagret r¨acker ˚atminstone denna tid med
sannolikhet 0.9. (3p)
7. L¨akaren Evrim ¨ar skeptisk mot homeopatmediciner. Hon beslutar sig f¨or att prova om ett nylanserat preparat s¨anker kolesterolniv˚an f¨or 9 slumpm¨assigt utvalda patienter. Resultatet, i kodade enheter, ˚aterges nedan.
Patient 1 2 3 4 5 6 7 8 9
F¨ore 4.29 4.25 3.81 5.02 3.57 3.16 3.98 4.37 3.86 Efter 4.69 4.80 2.47 5.17 3.31 3.36 4.46 3.99 3.84
Ber¨akna ett 99%-igt konfidensintervall f¨or preparatets genomsnittliga effekt under rimliga normalf¨ordelningsantaganden. (Effekten ¨ar positiv om preparatet i genomsnitt minskar kolesterolv¨ardet.) Svara med den
¨ovre gr¨ansen. (2p)
8. Ett forskarteam intresserar sig f¨or om ett l¨akemedel som ges till gravi- da kvinnor minskar vikten hos deras barn vid f¨odelseln. Man antar att vikterna ¨ar normalf¨ordelade, d¨ar standardavvikelsen 0.454 best¨amts fr˚an ber¨akningar p˚a ett mycket stort antal f¨odslar. F¨or att se om man kan p˚avisa att v¨antev¨ardet µ ¨ar mindre ¨an 3.715, vilket ¨ar den ge- nomsnittslika sp¨adbarnsvikten i hela populationen, utf¨ors ett test p˚a 5 % signifikansniv˚a. Testet baseras p˚a 100 f¨odslar, d¨ar slutsatsen att µ < 3.715 dras om medelvikten ¨ar mindre ¨an 3.6403.
Medelvikten f¨or de 100 barnen blev 3.6920, s˚a forskarna kan inte dra n˚agra slutsatser p˚a 5 % signifikansniv˚a. F¨or att kunna anv¨anda detta till sin f¨ordel vill l¨akemedelsf¨oretaget som tillverkat preparatet ber¨akna testets styrka. Ber¨akna styrkan d˚a µ = 3.6. (2p)
9. Man ¨ar intresserad av den andel p av alla studenter p˚a ett visst uni- versitet som motitionerar minst tre g˚anger i veckan. En omfattande tidigare unders¨okning gav p = 0.35 och man vill nu se om andelen har
¨okat. F¨or att testa
H0: p = 0.35 mot H1 : p > 0.35
tillfr˚agas 15 slumpm¨assigt utvalda studenter och H0f¨orkastas om minst 9 av de 15 studenterna motitionerar minst tre g˚anger i veckan.
Vilken signifikansniv˚a har detta test? (2p)
10. Maja och Joel skall skriva en tenta f¨or ¨overbetyg. Efter att ha plug- gat tillsammans ¨ar deras betyg stokastiskt beroende och ges av den simultana sannolikhetsfunktionen
J \M 3 4 5
3 0.31 0.11 0.05 4 0.02 0.22 0.12 5 0.01 0.03 0.13
Joel skriver tentan f¨orst, varp˚a Maja f˚ar veta att Joel fick ¨overbetyg, men inte vilket av betygen 4 och 5 som Joel fick.
(a) Ber¨akna sannolikheten att Maja ocks˚a f˚ar ¨overbetyg. (1p) (b) Ber¨akna det betingade v¨antev¨ardet av Majas betyg. (1p)
11. Den tv˚adimensionella slumpvariabeln ξ = (ξ, η) har likformig f¨ordelning p˚a det rektangul¨ara omr˚adet
R = {(x, y) ∈ R2: 0 ≤ x ≤ 4, 0 ≤ y ≤ 3}.
Ber¨akna sannolikheten att punkten ξ hamnar p˚a ett avst˚and fr˚an origo
som ¨ar st¨orre ¨an 1. (1p)
12. Handledsm˚attet p˚a den dominanta respektive icke-dominanta sidan f¨or en student p˚a Kinas st¨orsta universitet kan betraktas som en observa- tion p˚a en tv˚a-dimensionell normalf¨ordelning med kovariansmatris
C =
3.2400 2.8458 2.8458 2.8900
och v¨antev¨ardesvektor
17.630 17.120
,
d¨ar 17.63 ¨ar det genomsnittliga m˚attet p˚a den dominanta sidan.
Ber¨akna sannolikheten att en slumpm¨assigt vald student har st¨orre
handledsm˚att p˚a den dominanta sidan. (2p)
Slut p˚a del 1. Gl¨om inte att bifoga svarsbladet med tentan!
Tabell f¨or svar till del 1
Riv ut och l¨agg svarsbladet f¨orst i tentamen
Namn: . . . . Personnummer: . . . .
Fr˚aga Svar Po¨ang
1 Sannolikhet (tre decimaler) 0.624 2
2 Sannolikhet (tre decimaler) 0.637 3
3 Sannolikhet (tv˚a decimaler) 0.99 2
4 a och b a = −2, b = 2 2
5 V¨antev¨arde och varians (tv˚a decimaler) V¨antev¨ardet ¨ar 6, Variansen 9.33
2
6 tiden T (tre decimaler) 17436.8 3
7 Ovre gr¨¨ ans (tv˚a decimaler) 0.68 2
8 Styrka (tre decimaler) Φ(0.88) = 0.813 2
9 Signifikansniv˚a (tre decimaler) 0.042 2
10 a Sannolikhet (fyra decimaler) 0.9433 1
b V¨antev¨arde (fyra decimaler) 4.4151 1
11 Sannolikhet (tre decimaler) 0.935 1
12 Sannolikhet (tre decimaler) 0.779 2
Totalt antal po¨ang 25
Vid bed¨omningen av l¨osningarna av uppgifterna i del 2 l¨aggs stor vikt vid hur l¨osningarna ¨ar motiverade och redovisade. T¨ank p˚a att noga redovisa inf¨orda beteckningar och eventuella antaganden.
13. I ett f¨oretags lager finns 73 batterier av typ a och 56 batterier av typ b.
Man vet att livsl¨angderna f¨or batterierna ¨ar Exponentialf¨ordelade, d¨ar sannolikheten att ett batteri r¨acker mer ¨an 100 driftstimmar ¨ar 0.95 f¨or batterier av typ a och 0.97 f¨or typ b. Om man v¨aljer ut 35 batterier p˚a m˚af˚a fr˚an lagret, vad ¨ar d˚a v¨antev¨ardet av den totala livsl¨angden
f¨or de 35 batterierna? Ledning: Lagen om totalt v¨antev¨arde. (10p)
L¨osningsskiss F¨orst best¨ams f¨orv¨antad livsl¨angd f¨or batterier av typ a och b fr˚an f¨oruts¨attningarna som ges i uppgiften. Vi f˚ar 1/λa= 1950 och λb = 3283 med hj¨alp av f¨ordelningsfunktionen F (x) = 1 − e−λx f¨or exponentialf¨ordelningen. S¨okt ¨ar E(ξ), d¨ar ξ ¨ar den totala livsl¨angden f¨or de 35 batterierna. L˚at η vara antalet batterier av typ a i urvalet.
Vi har E[ξ|η = y] = 1950y + 3283(35 − y) = 114905 − 1233y, s˚a E[ξ|η] = 114905 + 1233η.
Eftersom η ∈ Hyp(N, p, n), d¨ar N = 129, p = 73/129, n = 35, ger lagen om totalt v¨antev¨arde och formelbladet att E[ξ] = 423517 − 1233E(η) = 114905 − 1233np = 88496.
Ett alternativt s¨att att l¨osa uppgiften ¨ar att skriva ξ =P35
j=1ξj, d¨ar ξj ¨ar livsl¨angden f¨or batteri j. Slumpvariablerna ξ1, ξ2, . . . , ξ35 ¨ar inte oberoende men det g¨aller fortfarande att E[ξ] =P35
j=1E[ξj]. (Del (b) av Sats 5A g¨aller ju ¨aven f¨or beroende slumpvariabler.) Sannolikheten att batteri nummer j ¨ar av typ a ¨ar 73/129 s˚a E[ξj] = E[ξj|λ = λa]73/129 + E[ξj|λ = λa]56/129 = 2528.4. Det ger E[ξ] = 35 · 2528.4 = 88496.
14. Xie ¨ar kvalitetsansvarig p˚a ett kinesiskt f¨oretag som tillverkar ¨atpinnar.
Pinnarna m˚aste vara tillr¨ackligt raka, och f¨oretagets m˚al ¨ar att minst 99.5 % av alla pinnar skall uppfylla ett v¨aletablerat m˚att p˚a rakhet. F¨or att uppt¨acka om det finns systemfel skall du hj¨alpa Xie st¨alla upp ett test baserat p˚a en unders¨okning av 2000 slumpm¨assigt utvalda pinnar.
F¨or full po¨ang kr¨avs att du anv¨ander v¨almotiverade approximationer f¨or att f¨orenkla ber¨akningar av testets egenskaper.
(a) St¨all upp hypoteser och definiera en beslutsregel s˚a att Xie f˚ar ett test med en signifikansniv˚a n¨ara 5 %. (5p) (b) Ber¨akna styrkan f¨or testet i (a) om 99.25 % av pinnarna ¨ar
tillr¨ackligt raka. (5p)
L¨osningsskiss L˚at ξ vara antalet sneda pinnar. Vi har ξ ∈ Bin(2000, p), d¨ar p ¨ar andelen sneda pinnar i det l˚anga loppet (dvs. sannolikheten att en pinne ¨ar sned).
(a) Vi testar H0 : p = 0.005 mot H1 : p > 0.005 med beslutsregeln:
f¨orkasta H0 om ξ ≥ k. D˚a p = 0.005 har vi 2000p(1 − p) < 10 s˚a tumregeln f¨or normalapproximation ¨ar inte uppfylld. Men vi har
approximativt ξ ∈ P o(10). Med hj¨alp av Poissontabellen f˚ar vi att k = 16 ger ett test med ca 4.87% signifikansniv˚a. (5p) (b) Poissontabellen ger att styrkan d˚a p = 0.0075 ¨ar ca 44%. (5p)
15. Joel och Maja har gl¨omt bort vad cirkeln med radie 1 har f¨or area, vilket ¨ar ett problem eftersom dom ¨ar strandsatta p˚a en ¨ode ¨o d¨ar cirkelns area ¨ar avg¨orande f¨or en livsn¨odv¨andig konstruktion. Maja kommer p˚a ett s¨att att generera slumptal fr˚an R(−1, 1)-f¨ordelningen med hj¨alp av sin kompass och skattar cirkelns area med 10000 talpar och metoden som anv¨andes p˚a Lab 4. Joel p˚apekar att ¨aven om skatt- ningen av arean efter n talpar, som vi kan beteckna Sn, n¨armar sig arean d˚a n g˚ar mot o¨andligheten enligt Stora Talens Lag s˚a kan Maja aldrig veta hur l¨ange hon m˚aste h˚alla p˚a f¨or att f˚a en noggrannhet p˚a
= 10−2.
Anv¨and Centrala gr¨ansv¨ardessatsen och det faktum att cirkelns area
¨ar lika med π f¨or ber¨akna sannolikheten att skattningen S10000 ger ett
fel p˚a h¨ogst 10−2. (10p)
L¨osningsskiss L˚at ¯ξnvara andelen av f¨orsta n punkterna som hamnar innanf¨or cirkeln (Fn p˚a labben). Skattningen av π ¨ar Sn= 4 ¯ξn. Vi har
P (|Sn− π| ≤ 10−2) =P (| ¯ξn− π/4| ≤ 1
410−2) (1)
=P (−10−2/4 ≤ ¯ξn− π/4 ≤ 10−2/4) (2)
=P (π/4 − 10−2/4 ≤ ¯ξn≤ π/4 + 10−2/4). (3) H¨ar ¨ar n ¯ξn ∈ Bin(n, p), p = π/4, s˚a CGS ger approximationerna n ¯ξn ∈ N (np,pnp(1 − p)) och ¯ξn ∈ N (p,pp(1 − p)/n). Det ger oss till exempel P (|S10000− π| ≤ 10−2) ' 0.45. (F¨or att skattningen skall ge ett fel p˚a h¨ogst 10−2 med sannolikhet minst 95 % kr¨avs 100 000 talpar. F¨or att felet skall vara h¨ogst 10−3 med sannolikhet minst 95
% kr¨avs 10 miljoner talpar. F¨or att felet skall vara h¨ogst 10−5 med sannolikhet minst 95 % kr¨avs att Maja tar fram 100 miljarder talpar.)
Lab 4 i S0008M, vt 2012 Simuleringsmetoder
Litteratur: Kompendium om flerdimensionella f¨ordelningar
Problembeskrivning
Alla vet att arean av en cirkel med radie 1 ¨ar lika med π och att volymen f¨or klotet med samma radie ¨ar 4π/3. Men vilken volym har klotet Bd med radie 1 i d dimensioner?
Id´en bakom den statistiska metoden ¨ar enkel och kan i detta fall beskri- vas enligt f¨oljande: L˚at Kd vara kuben i d dimensioner med centrum i origo och vars sida ¨ar 2. Dess volym vol(Kd) ¨ar 2d. Om man v¨aljer m˚anga punkter slumpm¨assigt fr˚an Kd (med likformig f¨ordelning) s˚a ger andelen punkter som hamnar innanf¨or klotet Bd ge en god ap- proximation av vol(Bd)/2d, d¨ar vol(Bd) ¨ar volymen f¨or Bd.
Kommandon i Matlab
Det enda statistik-kommandot som beh¨ovs ¨ar kommandot rand. Det ger ett slumptal fr˚an R(0, 1) f¨ordelningen. N˚agra anv¨anbara varianter
¨ar rand(1,2), som ger tv˚a oberoende slumptal fr˚an R(0, 1) f¨ordelningen, samt rand(N,2), som ger N oberoende par av slumptal fr˚an R(0, 1).
Du kan l¨asa mer genom att skriva help rand. ¨Aven kommandot norm, som ber¨aknar l¨angden pξ12+ . . . + ξn2 av vektorn ξ = (ξ1, . . . , ξn), ¨ar anv¨andbart.
Uppgift 1 - Ber¨ akning av π
(a) Om ξ1och ξ2 ¨ar oberoende och R(−1, 1)-f¨ordelade slumpvariabler s˚a ¨ar den tv˚adimensionella slumpvariabeln ξ = (ξ1, ξ2) likformigt f¨ordelad p˚a kvadraten
K2= {(x1, x2) : −1 ≤ x1 ≤ 1, −1 ≤ x2, ≤ 1}.
Varf¨or ¨ar det s˚a? F¨orklara tydligt, g¨arna med h¨anvisning till de- finitioner och resultat f¨or tv˚adimensionella f¨ordelningar.
(b) Deklarera variabeln N i ditt Matlab script och ge den v¨ardet 100 till att b¨orja med. Generera N oberoende observationer p˚a en tv˚adimensionell slumpvariabel med likformig f¨ordelning p˚a K2. Fixa s˚a att ditt script som f¨or varje par av observationer x1, x2 kollar om punkten (x1, x2) ligger inuti B2, d¨ar
B2= {(x1, x2) : q
x21+ x22≤ 1}
¨ar cirkelskivan med centrum i origo och radie 1. Plotta Fn mot n, n = 1, 2, . . . , N , d¨ar Fn¨ar andelen av de n f¨orsta punterna som ligger i B2.