• No results found

Lab 4 i S0008M, vt 2012 Simuleringsmetoder

N/A
N/A
Protected

Academic year: 2021

Share "Lab 4 i S0008M, vt 2012 Simuleringsmetoder"

Copied!
9
0
0

Loading.... (view fulltext now)

Full text

(1)

Po¨ang totalt f¨or del 1: 25 (12 uppgifter) Tentamensdatum 2012-06-02 Po¨ang totalt f¨or del 2: 30 (3 uppgifter) Skrivtid 09.00 – 14.00 L¨arare: Adam Jonsson och Ove Edlund

Jourhavande l¨arare: Adam Jonsson Tel: 0920-491948

Till˚atna hj¨alpmedel: • R¨aknedosa,

• Kursboken V¨annman: Matematisk statistik. I kursboken f˚ar anteckningar och post-it lappar finnas, men inte l¨osta exempel.

• Kompendium om flerdimensionella f¨ordelningar

• Formelblad

• Tabeller

Tentamen best˚ar av tv˚a delar. P˚a den f¨orsta delen, som ¨ar obligatorisk f¨or att kunna bli godk¨and, ska enbart svar l¨amnas in, men l¨osningar f˚ar bifogas. Observera dock att dessa ej kommer att bed¨omas utan enbart anv¨andas vid gr¨ansfall f¨or att avg¨ora om n˚agon uppgift kan ”r¨attas upp” p˚a grund av slarvfel. P˚a del 1 ges inga delpo¨ang p˚a uppgifterna.

Svaren f¨or del 1 ska fyllas i p˚a det blad som bifogas tentamen. Detta blad m˚aste l¨amnas in. L¨agg detta blad f¨orst bland l¨osningarna. Om inte det ifyllda svarsbladet har l¨amnats in s˚a bed¨oms tentamen som underk¨and. F¨or godk¨ant kr¨avs minst 17 po¨ang p˚a del 1. Med 2 extrapo¨ang fr˚an laborationerna och KGB s˚a r¨acker det allts˚a med 15 po¨ang av de 25 m¨ojliga f¨or godk¨ant.

P˚a den andra delen, som g¨aller tentamen f¨or ¨overbetyg, ska fullst¨andiga l¨osningar l¨amnas in. T¨ank p˚a att redovisa dina l¨osningar p˚a ett klart och tydligt s¨att och motivera resonemangen. Vid bed¨omningen av l¨osningarna l¨aggs stor vikt vid hur l¨osningarna ¨ar motiverade och redovisade. F¨or betyg 4 kr¨avs godk¨ant p˚a den f¨orsta obligatoriska delen samt minst 13 po¨ang fr˚an den andra delen f¨or ¨overbetyg. F¨or betyg 5 kr¨avs godk¨ant p˚a den f¨orsta obligatoriska delen samt minst 23 po¨ang fr˚an den andra delen f¨or ¨overbetyg.

OBS! Det g˚ar inte att kompensera underk¨ant p˚a den f¨orsta korta delen av tentamen med po¨ang p˚a den andra delen.

Ange p˚a tentamensomslaget om du har l¨amnat in l¨osningar p˚a del 2 genom att kryssa f¨or de sista tre uppgifterna.

Om du plussar f¨or ¨overbetyg s˚a skriv detta p˚a tentamensomslaget.

LYCKA TILL!

(2)

1. Antag att 6 % av alla bilf¨orare k¨or berusat. Antag ocks˚a att sanno- likheten att en berusad person somnar under bilk¨orningen ¨ar 0.26 och att motsvarande sannolikhet f¨or en nykter person ¨ar 0.01. En olycka intr¨affar, och det konstateras att bilf¨oraren somnat vid ratten. Vad ¨ar

sannolikheten att f¨oraren var berusad? (2p)

2. Antag att du har ett stickprov av storlek 8 fr˚an en kontinuerlig f¨ordelning och att medianen i f¨ordelningen ¨ar lika med 6.5. Ber¨akna sannolikhe- ten att h¨ogst 4 av stickprovsvariablerna antar ett v¨arde som ¨ar st¨orre

¨an 6.5. (3p)

3. I en beh˚allare finns 15 atomk¨arnor som efter en slumpm¨assig tid f¨orintas genom s.k. alfas¨onderfall, d¨ar en atomk¨arna s¨onderfaller och avger en alfapartikel. Den f¨orv¨antade tiden till s¨onderfall ¨ar lika med 3 sekunder.

Att tiden f¨or s¨onderfallet ¨ar Exponentialf¨ordelad kan delvis f¨orklaras med att atom¨ara partiklar inte ˚aldras.

Ber¨akna sannolikheten att det tar mindre ¨an 1 sekund f¨or antalet

atomk¨arnor att reduceras till 14. (2p)

4. Betrakta funktionen f (x) =

(ax + b om 0 ≤ x ≤ 1, 0 annars,

d¨ar a och b ¨ar konstanter. Det finns flera v¨arden p˚a a och b f¨or vilka f ¨ar en frekvensfunktion, men endast ett par av v¨arden som g¨or att v¨antev¨ardet i f¨ordelningen ¨ar lika med 1/3. Vilka ¨ar dessa v¨arden? (2p) 5. Thomas tar sp˚arvagnen till jobbet varje morgon. V¨antetiden i minuter

kan betrakas som en slumpvariabel med R(0, 10)-f¨ordelning. V¨al p˚a jobbet m˚aste Thomas v¨anta en Exp(1)-f¨ordelad tid p˚a att hans dator ska starta. Ber¨akna v¨antev¨arde och varians f¨or den totala tid som

Thomas v¨antar varje morgon. (2p)

6. Livsl¨angden (enhet: timmar) f¨or en viss typ av elektronr¨or ¨ar exponen- tialf¨ordelad med λ = 0.005. Ett s˚adan r¨or ing˚ar i en radarutrustning p˚a ett fartyg, d¨ar man i ett lager under d¨ack har 100 elektronr¨or. N¨ar ett elektronr¨or g˚ar s¨onder byts det genast ut.

Ber¨akna en tid T s˚adan att lagret r¨acker ˚atminstone denna tid med

sannolikhet 0.9. (3p)

7. L¨akaren Evrim ¨ar skeptisk mot homeopatmediciner. Hon beslutar sig f¨or att prova om ett nylanserat preparat s¨anker kolesterolniv˚an f¨or 9 slumpm¨assigt utvalda patienter. Resultatet, i kodade enheter, ˚aterges nedan.

Patient 1 2 3 4 5 6 7 8 9

F¨ore 4.29 4.25 3.81 5.02 3.57 3.16 3.98 4.37 3.86 Efter 4.69 4.80 2.47 5.17 3.31 3.36 4.46 3.99 3.84

(3)

Ber¨akna ett 99%-igt konfidensintervall f¨or preparatets genomsnittliga effekt under rimliga normalf¨ordelningsantaganden. (Effekten ¨ar positiv om preparatet i genomsnitt minskar kolesterolv¨ardet.) Svara med den

¨ovre gr¨ansen. (2p)

8. Ett forskarteam intresserar sig f¨or om ett l¨akemedel som ges till gravi- da kvinnor minskar vikten hos deras barn vid f¨odelseln. Man antar att vikterna ¨ar normalf¨ordelade, d¨ar standardavvikelsen 0.454 best¨amts fr˚an ber¨akningar p˚a ett mycket stort antal f¨odslar. F¨or att se om man kan p˚avisa att v¨antev¨ardet µ ¨ar mindre ¨an 3.715, vilket ¨ar den ge- nomsnittslika sp¨adbarnsvikten i hela populationen, utf¨ors ett test p˚a 5 % signifikansniv˚a. Testet baseras p˚a 100 f¨odslar, d¨ar slutsatsen att µ < 3.715 dras om medelvikten ¨ar mindre ¨an 3.6403.

Medelvikten f¨or de 100 barnen blev 3.6920, s˚a forskarna kan inte dra n˚agra slutsatser p˚a 5 % signifikansniv˚a. F¨or att kunna anv¨anda detta till sin f¨ordel vill l¨akemedelsf¨oretaget som tillverkat preparatet ber¨akna testets styrka. Ber¨akna styrkan d˚a µ = 3.6. (2p)

9. Man ¨ar intresserad av den andel p av alla studenter p˚a ett visst uni- versitet som motitionerar minst tre g˚anger i veckan. En omfattande tidigare unders¨okning gav p = 0.35 och man vill nu se om andelen har

¨okat. F¨or att testa

H0: p = 0.35 mot H1 : p > 0.35

tillfr˚agas 15 slumpm¨assigt utvalda studenter och H0f¨orkastas om minst 9 av de 15 studenterna motitionerar minst tre g˚anger i veckan.

Vilken signifikansniv˚a har detta test? (2p)

10. Maja och Joel skall skriva en tenta f¨or ¨overbetyg. Efter att ha plug- gat tillsammans ¨ar deras betyg stokastiskt beroende och ges av den simultana sannolikhetsfunktionen

J \M 3 4 5

3 0.31 0.11 0.05 4 0.02 0.22 0.12 5 0.01 0.03 0.13

Joel skriver tentan f¨orst, varp˚a Maja f˚ar veta att Joel fick ¨overbetyg, men inte vilket av betygen 4 och 5 som Joel fick.

(a) Ber¨akna sannolikheten att Maja ocks˚a f˚ar ¨overbetyg. (1p) (b) Ber¨akna det betingade v¨antev¨ardet av Majas betyg. (1p)

11. Den tv˚adimensionella slumpvariabeln ξ = (ξ, η) har likformig f¨ordelning p˚a det rektangul¨ara omr˚adet

R = {(x, y) ∈ R2: 0 ≤ x ≤ 4, 0 ≤ y ≤ 3}.

Ber¨akna sannolikheten att punkten ξ hamnar p˚a ett avst˚and fr˚an origo

som ¨ar st¨orre ¨an 1. (1p)

(4)

12. Handledsm˚attet p˚a den dominanta respektive icke-dominanta sidan f¨or en student p˚a Kinas st¨orsta universitet kan betraktas som en observa- tion p˚a en tv˚a-dimensionell normalf¨ordelning med kovariansmatris

C =

 3.2400 2.8458 2.8458 2.8900



och v¨antev¨ardesvektor

 17.630 17.120

 ,

d¨ar 17.63 ¨ar det genomsnittliga m˚attet p˚a den dominanta sidan.

Ber¨akna sannolikheten att en slumpm¨assigt vald student har st¨orre

handledsm˚att p˚a den dominanta sidan. (2p)

Slut p˚a del 1. Gl¨om inte att bifoga svarsbladet med tentan!

(5)

Tabell f¨or svar till del 1

Riv ut och l¨agg svarsbladet f¨orst i tentamen

Namn: . . . . Personnummer: . . . .

Fr˚aga Svar Po¨ang

1 Sannolikhet (tre decimaler) 0.624 2

2 Sannolikhet (tre decimaler) 0.637 3

3 Sannolikhet (tv˚a decimaler) 0.99 2

4 a och b a = −2, b = 2 2

5 V¨antev¨arde och varians (tv˚a decimaler) V¨antev¨ardet ¨ar 6, Variansen 9.33

2

6 tiden T (tre decimaler) 17436.8 3

7 Ovre gr¨¨ ans (tv˚a decimaler) 0.68 2

8 Styrka (tre decimaler) Φ(0.88) = 0.813 2

9 Signifikansniv˚a (tre decimaler) 0.042 2

10 a Sannolikhet (fyra decimaler) 0.9433 1

b V¨antev¨arde (fyra decimaler) 4.4151 1

11 Sannolikhet (tre decimaler) 0.935 1

12 Sannolikhet (tre decimaler) 0.779 2

Totalt antal po¨ang 25

(6)
(7)

Vid bed¨omningen av l¨osningarna av uppgifterna i del 2 l¨aggs stor vikt vid hur l¨osningarna ¨ar motiverade och redovisade. T¨ank p˚a att noga redovisa inf¨orda beteckningar och eventuella antaganden.

13. I ett f¨oretags lager finns 73 batterier av typ a och 56 batterier av typ b.

Man vet att livsl¨angderna f¨or batterierna ¨ar Exponentialf¨ordelade, d¨ar sannolikheten att ett batteri r¨acker mer ¨an 100 driftstimmar ¨ar 0.95 f¨or batterier av typ a och 0.97 f¨or typ b. Om man v¨aljer ut 35 batterier p˚a m˚af˚a fr˚an lagret, vad ¨ar d˚a v¨antev¨ardet av den totala livsl¨angden

f¨or de 35 batterierna? Ledning: Lagen om totalt v¨antev¨arde. (10p)

L¨osningsskiss F¨orst best¨ams f¨orv¨antad livsl¨angd f¨or batterier av typ a och b fr˚an f¨oruts¨attningarna som ges i uppgiften. Vi f˚ar 1/λa= 1950 och λb = 3283 med hj¨alp av f¨ordelningsfunktionen F (x) = 1 − e−λx f¨or exponentialf¨ordelningen. S¨okt ¨ar E(ξ), d¨ar ξ ¨ar den totala livsl¨angden f¨or de 35 batterierna. L˚at η vara antalet batterier av typ a i urvalet.

Vi har E[ξ|η = y] = 1950y + 3283(35 − y) = 114905 − 1233y, s˚a E[ξ|η] = 114905 + 1233η.

Eftersom η ∈ Hyp(N, p, n), d¨ar N = 129, p = 73/129, n = 35, ger lagen om totalt v¨antev¨arde och formelbladet att E[ξ] = 423517 − 1233E(η) = 114905 − 1233np = 88496.

Ett alternativt s¨att att l¨osa uppgiften ¨ar att skriva ξ =P35

j=1ξj, d¨ar ξj ¨ar livsl¨angden f¨or batteri j. Slumpvariablerna ξ1, ξ2, . . . , ξ35 ¨ar inte oberoende men det g¨aller fortfarande att E[ξ] =P35

j=1E[ξj]. (Del (b) av Sats 5A g¨aller ju ¨aven f¨or beroende slumpvariabler.) Sannolikheten att batteri nummer j ¨ar av typ a ¨ar 73/129 s˚a E[ξj] = E[ξj|λ = λa]73/129 + E[ξj|λ = λa]56/129 = 2528.4. Det ger E[ξ] = 35 · 2528.4 = 88496.

14. Xie ¨ar kvalitetsansvarig p˚a ett kinesiskt f¨oretag som tillverkar ¨atpinnar.

Pinnarna m˚aste vara tillr¨ackligt raka, och f¨oretagets m˚al ¨ar att minst 99.5 % av alla pinnar skall uppfylla ett v¨aletablerat m˚att p˚a rakhet. F¨or att uppt¨acka om det finns systemfel skall du hj¨alpa Xie st¨alla upp ett test baserat p˚a en unders¨okning av 2000 slumpm¨assigt utvalda pinnar.

F¨or full po¨ang kr¨avs att du anv¨ander v¨almotiverade approximationer f¨or att f¨orenkla ber¨akningar av testets egenskaper.

(a) St¨all upp hypoteser och definiera en beslutsregel s˚a att Xie f˚ar ett test med en signifikansniv˚a n¨ara 5 %. (5p) (b) Ber¨akna styrkan f¨or testet i (a) om 99.25 % av pinnarna ¨ar

tillr¨ackligt raka. (5p)

L¨osningsskiss L˚at ξ vara antalet sneda pinnar. Vi har ξ ∈ Bin(2000, p), d¨ar p ¨ar andelen sneda pinnar i det l˚anga loppet (dvs. sannolikheten att en pinne ¨ar sned).

(a) Vi testar H0 : p = 0.005 mot H1 : p > 0.005 med beslutsregeln:

f¨orkasta H0 om ξ ≥ k. D˚a p = 0.005 har vi 2000p(1 − p) < 10 s˚a tumregeln f¨or normalapproximation ¨ar inte uppfylld. Men vi har

(8)

approximativt ξ ∈ P o(10). Med hj¨alp av Poissontabellen f˚ar vi att k = 16 ger ett test med ca 4.87% signifikansniv˚a. (5p) (b) Poissontabellen ger att styrkan d˚a p = 0.0075 ¨ar ca 44%. (5p)

15. Joel och Maja har gl¨omt bort vad cirkeln med radie 1 har f¨or area, vilket ¨ar ett problem eftersom dom ¨ar strandsatta p˚a en ¨ode ¨o d¨ar cirkelns area ¨ar avg¨orande f¨or en livsn¨odv¨andig konstruktion. Maja kommer p˚a ett s¨att att generera slumptal fr˚an R(−1, 1)-f¨ordelningen med hj¨alp av sin kompass och skattar cirkelns area med 10000 talpar och metoden som anv¨andes p˚a Lab 4. Joel p˚apekar att ¨aven om skatt- ningen av arean efter n talpar, som vi kan beteckna Sn, n¨armar sig arean d˚a n g˚ar mot o¨andligheten enligt Stora Talens Lag s˚a kan Maja aldrig veta hur l¨ange hon m˚aste h˚alla p˚a f¨or att f˚a en noggrannhet p˚a

 = 10−2.

Anv¨and Centrala gr¨ansv¨ardessatsen och det faktum att cirkelns area

¨ar lika med π f¨or ber¨akna sannolikheten att skattningen S10000 ger ett

fel p˚a h¨ogst 10−2. (10p)

L¨osningsskiss L˚at ¯ξnvara andelen av f¨orsta n punkterna som hamnar innanf¨or cirkeln (Fn p˚a labben). Skattningen av π ¨ar Sn= 4 ¯ξn. Vi har

P (|Sn− π| ≤ 10−2) =P (| ¯ξn− π/4| ≤ 1

410−2) (1)

=P (−10−2/4 ≤ ¯ξn− π/4 ≤ 10−2/4) (2)

=P (π/4 − 10−2/4 ≤ ¯ξn≤ π/4 + 10−2/4). (3) H¨ar ¨ar n ¯ξn ∈ Bin(n, p), p = π/4, s˚a CGS ger approximationerna n ¯ξn ∈ N (np,pnp(1 − p)) och ¯ξn ∈ N (p,pp(1 − p)/n). Det ger oss till exempel P (|S10000− π| ≤ 10−2) ' 0.45. (F¨or att skattningen skall ge ett fel p˚a h¨ogst 10−2 med sannolikhet minst 95 % kr¨avs 100 000 talpar. F¨or att felet skall vara h¨ogst 10−3 med sannolikhet minst 95

% kr¨avs 10 miljoner talpar. F¨or att felet skall vara h¨ogst 10−5 med sannolikhet minst 95 % kr¨avs att Maja tar fram 100 miljarder talpar.)

(9)

Lab 4 i S0008M, vt 2012 Simuleringsmetoder

Litteratur: Kompendium om flerdimensionella f¨ordelningar

Problembeskrivning

Alla vet att arean av en cirkel med radie 1 ¨ar lika med π och att volymen f¨or klotet med samma radie ¨ar 4π/3. Men vilken volym har klotet Bd med radie 1 i d dimensioner?

Id´en bakom den statistiska metoden ¨ar enkel och kan i detta fall beskri- vas enligt f¨oljande: L˚at Kd vara kuben i d dimensioner med centrum i origo och vars sida ¨ar 2. Dess volym vol(Kd) ¨ar 2d. Om man v¨aljer m˚anga punkter slumpm¨assigt fr˚an Kd (med likformig f¨ordelning) s˚a ger andelen punkter som hamnar innanf¨or klotet Bd ge en god ap- proximation av vol(Bd)/2d, d¨ar vol(Bd) ¨ar volymen f¨or Bd.

Kommandon i Matlab

Det enda statistik-kommandot som beh¨ovs ¨ar kommandot rand. Det ger ett slumptal fr˚an R(0, 1) f¨ordelningen. N˚agra anv¨anbara varianter

¨ar rand(1,2), som ger tv˚a oberoende slumptal fr˚an R(0, 1) f¨ordelningen, samt rand(N,2), som ger N oberoende par av slumptal fr˚an R(0, 1).

Du kan l¨asa mer genom att skriva help rand. ¨Aven kommandot norm, som ber¨aknar l¨angden pξ12+ . . . + ξn2 av vektorn ξ = (ξ1, . . . , ξn), ¨ar anv¨andbart.

Uppgift 1 - Ber¨ akning av π

(a) Om ξ1och ξ2 ¨ar oberoende och R(−1, 1)-f¨ordelade slumpvariabler s˚a ¨ar den tv˚adimensionella slumpvariabeln ξ = (ξ1, ξ2) likformigt f¨ordelad p˚a kvadraten

K2= {(x1, x2) : −1 ≤ x1 ≤ 1, −1 ≤ x2, ≤ 1}.

Varf¨or ¨ar det s˚a? F¨orklara tydligt, g¨arna med h¨anvisning till de- finitioner och resultat f¨or tv˚adimensionella f¨ordelningar.

(b) Deklarera variabeln N i ditt Matlab script och ge den v¨ardet 100 till att b¨orja med. Generera N oberoende observationer p˚a en tv˚adimensionell slumpvariabel med likformig f¨ordelning p˚a K2. Fixa s˚a att ditt script som f¨or varje par av observationer x1, x2 kollar om punkten (x1, x2) ligger inuti B2, d¨ar

B2= {(x1, x2) : q

x21+ x22≤ 1}

¨ar cirkelskivan med centrum i origo och radie 1. Plotta Fn mot n, n = 1, 2, . . . , N , d¨ar Fn¨ar andelen av de n f¨orsta punterna som ligger i B2.

References

Related documents

F¨ or godk¨ ant kr¨ avs minst 15 po¨ ang totalt och minst 4 po¨ ang p˚ a sannolikhetsteori- och statistik-delen vardera samt minst 3 po¨ ang p˚ a bioinfor-

OBS. L¨ osningen skall motiveras, och svaret skall ges i formen av produkter, och/eller summor, av hela tal... 4) (3p) Nio r¨ oda, nio bl˚ a och nio gr¨ ona men f¨ or ¨ ovrigt

L¨ osning. De tolv olika b¨ ockerna skall placeras i tre ettiketerade h¨ ogar med respektive 3, 5 och 4 element.. 4) (3p) Nio r¨ oda, nio bl˚ a och nio gr¨ ona men f¨ or ¨

OBS. En komplett l¨ osning med fullst¨ andiga motiveringar skall ges och svaret skall ges i formen av ett heltal... En komplett l¨ osning med fullst¨ andiga motiveringar skall ges

(Obs delpo¨ ang ges f¨ or svar som inte uppfyller alla av specifikationerna ovan.).. En komplett l¨ osning med fullst¨ andiga motiveringar

Att avst˚ andet ¨ ar minst tv˚ a till alla kodord inneb¨ ar att ordet ifr˚ aga inte g˚ ar att r¨ atta, dvs att summan av de fyra f¨ orsta kolonnerna inte finns med i matrisen...

Vi visar nu att de ¨ ar linj¨ art oberoende p˚ a intervallet x &gt; 0 genom att verifiera att Wronskideterminanten ¨ ar skild fr˚ an noll d¨ ar...

Vi noterar att denna ekvation redan ¨ ar p˚ a “r¨ att” form (skriver vi ekvationen p˚ a standardform och multiplicerar med den integrerande faktorn f˚ as precis detta uttryck),