• No results found

• Kursboken V¨ annman: Matematisk statistik. I kursboken f˚ ar anteckningar och post-it lappar finnas, men inte l¨ osta exempel.

N/A
N/A
Protected

Academic year: 2021

Share "• Kursboken V¨ annman: Matematisk statistik. I kursboken f˚ ar anteckningar och post-it lappar finnas, men inte l¨ osta exempel."

Copied!
9
0
0

Loading.... (view fulltext now)

Full text

(1)

Po¨ ang totalt f¨ or del 1: 25 (8 uppgifter) Tentamensdatum 2011-03-25 Po¨ ang totalt f¨ or del 2: 30 (3 uppgifter) Skrivtid 09.00 – 14.00 L¨ arare: Adam Jonsson, Erland Gadde, Ove Edlund

Jourhavande l¨ arare: Adam Jonsson Tel: 0766-317460

Till˚ atna hj¨ alpmedel: • R¨ aknedosa,

• Kursboken V¨ annman: Matematisk statistik. I kursboken f˚ ar anteckningar och post-it lappar finnas, men inte l¨ osta exempel.

• Kompendium i Regressionsanalys

• Formelblad

• Tabeller

Tentamen best˚ ar av tv˚ a delar. P˚ a den f¨ orsta delen, som ¨ ar obligatorisk f¨ or att kunna bli godk¨ and, ska enbart svar l¨ amnas in, men l¨ osningar f˚ ar bifogas. Observera dock att dessa kommer ej att bed¨ omas utan enbart anv¨ andas vid gr¨ ansfall f¨ or att avg¨ ora om n˚ agon uppgift kan ”r¨ attas upp” p˚ a grund av slarvfel. P˚ a del 1 ges inga delpo¨ ang p˚ a uppgifterna.

Svaren f¨ or del 1 ska fyllas i p˚ a det blad som bifogas tentamen. Detta blad m˚ aste l¨ amnas in. L¨ agg detta blad f¨ orst bland l¨ osningarna. Om inte det ifyllda svarsbladet har l¨ amnats in s˚ a bed¨ oms tentamen som underk¨ and. F¨ or godk¨ ant kr¨ avs minst 19 po¨ ang p˚ a del 1. Med 4 extrapo¨ ang fr˚ an laborationerna och KGB s˚ a r¨ acker det med 15 po¨ ang av de 25 m¨ ojliga f¨ or godk¨ ant. Observera att f¨ or omtentander utan bonuspo¨ ang kr¨ avs endast 17p f¨ or godk¨ ant.

P˚ a den andra delen, som g¨ aller tentamen f¨ or ¨ overbetyg, ska fullst¨ andiga l¨ osningar l¨ amnas in. T¨ ank p˚ a att redovisa dina l¨ osningar p˚ a ett klart och tydligt s¨ att och motivera resonemangen. Vid bed¨ omningen av l¨ osningarna l¨ aggs stor vikt vid hur l¨ osningarna ¨ ar motiverade och redovisade. F¨ or betyg 4 kr¨ avs godk¨ ant p˚ a den f¨ orsta obligatoriska delen samt minst 13 po¨ ang fr˚ an den andra delen f¨ or ¨ overbetyg. F¨ or betyg 5 kr¨ avs godk¨ ant p˚ a den f¨ orsta obligatoriska delen samt minst 23 po¨ ang fr˚ an den andra delen f¨ or ¨ overbetyg.

OBS! Det g˚ ar inte att kompensera underk¨ ant p˚ a den f¨ orsta korta delen av tentamen med po¨ ang p˚ a den andra delen.

Ange p˚ a tentamensomslaget om du har l¨ amnat in l¨ osningar p˚ a del 2 genom att kryssa f¨ or de sista tre uppgifterna.

Om du plussar f¨ or ¨ overbetyg s˚ a skriv detta p˚ a tentamensomslaget.

LYCKA TILL!

(2)

1. I ett nordafrikanskt land bor 40 % av inv˚ anarna i V¨ astprovinsen, 40

% i Centralprovinsen och 20 % i ¨ Ostprovinsen. 50% av inv˚ anarna i V¨ astprovinsen st¨ oder det p˚ ag˚ aende reformarbetet i landet. Motsvarande siffra f¨ or Centralprovinsen ¨ ar 70% och f¨ or ¨ Ostprovinsen 80%. En inv˚ anare i landet v¨ aljs slumpm¨ assigt.

(a) Hur stor ¨ ar sannolikheten att personen st¨ oder reformarbetet? (2p) (b) Den utvalda personen st¨ oder reformarbetet. Hur stor ¨ ar sanno-

likheten att personen bor i ¨ Ostprovinsen? (2p) 2. En kortlek inneh˚ aller 52 kort. Av dessa kort ¨ ar 13 stycken m¨ arkta med

ett hj¨ arta. Dom korten kallar vi “hj¨ arter”.

(a) Man drar fem kort fr˚ an en v¨ al blandad kortlek. Hur stor ¨ ar san- nolikheten att man drar precis tv˚ a hj¨ arter? (2p) (b) Man drar ett kort fr˚ an var och en av fem v¨ al blandade kortlekar.

Hur stor ¨ ar sannolikheten att man drar precis tv˚ a hj¨ arter? (2p) 3. Ett f¨ oretag skall konstruera en hiss f¨ or transport av tillverkade enheter.

Enheternas vikter ¨ ar normalf¨ ordelade (enhet: kg) med v¨ antev¨ arde 250 och standardavvikelse 18. Hissens maxkapacitet ¨ ar av avg¨ orande be- tydelse f¨ or hur m˚ anga enheter som kan transporteras samtidigt.

(a) Ber¨ akna sannolikheten att hissen klarar av att transportera 3 slumpm¨ assigt utvalda enheter om maxkapaciteten ¨ ar 775. (2p) (b) Hur stor m˚ aste maxkapaciten (minst) vara f¨ or att sannolikheten

att hissen klarar av att transportera 3 slumpm¨ assigt utvalda en-

heter skall vara minst 95 %? (2p)

4. En fiskares v¨ antetider ξ 1 , ξ 2 , . . . mellan napp 1 antas vara oberoende och Exponentialf¨ ordelade med v¨ antev¨ arde 1/λ = 10 minuter. (Allts˚ a

¨ ar tex ξ 2 den tid som f¨ orflyter mellan det f¨ orsta och det andra nappet.) Fiskaren best¨ ammer sig f¨ or att inte g˚ a hem f¨ orr¨ an hon f˚ att 50 fiskar.

Anv¨ and Centrala gr¨ ansv¨ ardessatsen f¨ or att ber¨ akna sannolikheten den totala v¨ antetiden blir minst 10 timmar, dvs minst 600 minuter. (2p) 5. Johan har tv˚ a h¨ ogprecisionsv˚ agar. Han misst¨ anker att v˚ ag 1 i genom-

snitt visar en h¨ ogre vikt ¨ an v˚ ag 2. F¨ or att unders¨ oka detta v¨ ager han sig sj¨ alv sex g˚ anger. Resultatet i kilogram ges nedan:

M¨ atning 1 2 3 4 5 6

V˚ ag 1 78.3561 78.3321 78.3418 78.3627 78.3650 78.3557 V˚ ag 2 78.2917 78.3081 78.3131 78.3318 78.3444 78.2667 En ber¨ akning av medelv¨ arden och stickprovsstandardavvikelser gav

¯

x 1 = 78.352, ¯ x 2 = 78.309, s 1 = 0.0278, s 2 = 0.0128, ¯ z = 0.0429, s z = 0.0275.

(3)

6. Man vill testa om tv˚ a slumpvariablers standardavvikelser, σ 1 och σ 2 , kan vara lika stora eller om de skiljer sig ˚ at. Ett s¨ att att g¨ ora detta

¨

ar att bilda ett konfidensintervall f¨ or β, d¨ ar β ¨ ar kvoten σ 1 /σ 2 . An- tag att konfidensintervallet I har konstuerats med en metod som ger konfidensgrad 95%.

(a) Ange H 0 och H 1 . (1p)

(b) F¨ oresl˚ a en l¨ amplig beslutsregel. (Beslutsregeln skall vara av typen

“H 0 f¨ orkastas om intervallet I . . . ”) (1p) 7. Parametern λ > 0 anger en viss maskins effektivitet (antal producer-

ade enheter per timme). En naiv ingenj¨ or vill med hj¨ alp av en enda observation x fr˚ an en P o(λ)-f¨ ordelning testa H 0 : λ = 13 mot H 1 : λ < 13. F¨ or ¨ andam˚ alet anv¨ ander ingenj¨ oren x som testvariabel och beslutsregeln:

f¨ orkasta H 0 om x ≤ 7.

Ber¨ akna testets styrka d˚ a λ = 10. (2p)

Anm¨ arkning: Att testets styrka blir l˚ ag beror naturligtvis p˚ a att testet baseras p˚ a en enda observation. I praktiken skulle man anv¨ ant fler observationer.

8. Man analyserar livsl¨ angden (enhet: timmar) f¨ or tv˚ a olika typer av gr¨ asklippare med hj¨ alp av multipel linj¨ ar regressionsanalys och ett stickprov om 20 stycken maskiner, 10 maskiner av typ A och 10 mask- iner av typ B. Den beroende variabeln ¨ ar Liv och de f¨ orklarande vari- ablerna ¨ ar Speed, som anger maxhastigheten f¨ or rotorbladen (i kodade enheter), samt dummyvariabeln Typ, d¨ ar Typ= 0 f¨ or modell A och Typ= 1 f¨ or modell B. Resultatet ges p˚ a n¨ asta sida.

(a) Best¨ am residualspridningen s e . (1p)

(b) Best¨ am f¨ orklaringsgraden R 2 . (1p)

(c) F¨ or att avg¨ ora om Typ ska vara med som f¨ orklarande variabel p˚ a 5% signifikansniv˚ a, genomf¨ ors ett hypotestest med en “t-kvot”

som testvariabel. Ange det observerade v¨ ardet p˚ a denna testvari- abel, samt ange om Typ ska beh˚ allas som f¨ orklarande variabel.

(Ange “Ja” om Typ skall vara med i modellen.) (1p) (d) Finn ett 98% konfidensintervall f¨ or hur Liv f¨ or¨ andras i genomsnitt

d˚ a Speed ¨ okar med en enhet och Typ h˚ alls konstant. Svara med

den ¨ ovre gr¨ ansen. (2p)

(4)

Tabell 1: Regression Analysis: Material versus Glycerine; Speed The regression equation is

Liv = 1551 - 111 Speed + 202 Typ

Predictor Coef SE Coef T P

Constant 1550,72 91,43 ? ?

Speed -111,23 17,02 ? ?

Typ 201,95 76,32 ? ?

S = 157,914 R-Sq = ? % R-Sq(adj) = 79,0%

Analysis of Variance

Source DF SS MS F P

Regression ? 1829775 914888 36,69 0,000 Residual Error ? 423924 24937

Total ? ?

Slut p˚ a del 1. Gl¨ om inte att bifoga svarsbladet med tentan!

(5)

Tabell f¨ or svar till del 1

Riv ut och l¨ agg svarsbladet f¨ orst i tentamen

Namn: . . . . Personnummer: . . . .

Fr˚ aga Svar Po¨ ang

1 a Sannolikhet (procent, en decimal) 64.0 2

b Sannolikhet (procent, en decimal) 25.0 2

2 a Sannolikhet (procent, tv˚ a decimaler) 27.37 2

b Sannolikhet (procent, tv˚ a decimal) 26.43 2

3 a Sannolikhet (procent, en decimal) 78.81 Φ(0.8) 2

b Maxkapacitet (en decimal) 801.3 2

4 Sannolikhet (procent, en decimal) 7.9 2

5 Nedre gr¨ ans (fyra decimaler) 0.0085 2

6 a H 0 : β = 1 (σ 1 =

σ 2 g˚ ar ocks˚ a bra)

H 1 : β 6= 1 1

b H 0 f¨ orkastas om intervallet . . . . . . inte t¨ acker 1. 1

7 Styrka (procent, tv˚ a decimaler) 22.02 2

8 a Residualspridning (tre decimaler) 157.914 1

b F¨ orklaringsgrad (fyra decimaler) 0.8119 1

c obserat v¨ arde p˚ a testvariabeln (tv˚ a decimaler) 2.65

“Ja” eller “Nej” “Ja” 1

d Ovre gr¨ ¨ ans (fyra decimaler) -67.5397 2

Totalt antal po¨ ang 25

Om man r¨ aknade med medelv¨ arden och standardavvikelser p˚ a uppgift 5 och

inte observerade att ¯ x 1 och ¯ x 2 f¨ orv¨ axlats s˚ a ¨ ar det ok.

(6)
(7)

Vid bed¨ omningen av l¨ osningarna av uppgifterna i del 2 l¨ aggs stor vikt vid hur l¨ osningarna ¨ ar motiverade och redovisade. T¨ ank p˚ a att noga redovisa inf¨ orda beteckningar och eventuella antaganden.

10. F¨ or att Johans dator skall st¨ angas av kr¨ avs att datorn slutf¨ or tv˚ a processer. Den f¨ orsta processen tar alltid 3 sekunder att slutf¨ ora. Den tid ξ som det kr¨ avs f¨ or den andra procesen att avslutas ¨ ar slumpm¨ assig.

Det g¨ aller att ξ ∈ Exp(λ), d¨ ar λ > 0 ¨ ar en konstant. L˚ at ζ var den tid som det f¨ or datorn att slutf¨ ora de tv˚ a processerna.

(a) Verifiera att f¨ ordelningsfunktionen F ζ (x) f¨ or ζ ges av

F ζ (x) =

( 1 − e −λ(x−3) om x ≥ 3, 0 om x < 3.

(5p) (b) Best¨ am frekvensfunktionen f ζ (x) f¨ or ζ. (3p) L¨ osning

(a) Vi har ζ = ξ + a. F¨ ordelingsfunktionen f¨ or ξ ¨ ar F (x) = 1 − e −λx om x ≥ 0, noll annars. L˚ at F ζ vara f¨ ordelningsfunktionen f¨ or ζ. Vi har F ζ (x) =

P (ξ +a ≤ x) = P (ξ ≤ x−a) = F (x−a) =

( 1 − e −λ(x−a) om x ≥ a, 0 om x < a.

(b) Derivering ger

f ζ (x) = F ζ 0 (x) =

( λe −λ(x−a) om x ≥ a, 0 om x < a.

11. Antag att ξ 1 , . . . , ξ 5 ¨ ar ett stickprov fr˚ an R(0, b), d¨ ar b > 0 ¨ ar ok¨ and och skall skattas.

(a) Anv¨ and Sats 5A f¨ or att best¨ amma E[b 1 ], d¨ ar b 1 = 2 · ¯ ξ. ¨ Ar b 1

v¨ antev¨ ardesriktig? (2p)

(b) Verifiera att V (b 1 ) = b 2 /3. (2p)

(c) Man kan visa att frekvensfunktionen f¨ or skattningen b 2 = max(ξ 1 , . . . , ξ 5 )

ges av

f (x) = ( 5

b

5

x 4 om 0 ≤ x ≤ b, 0 annars.

Visa att b 2 inte ¨ ar v¨ antev¨ ardesriktig men att b 3 = 6

5 max(ξ 1 , . . . , ξ 2 )

¨ ar v¨ antev¨ ardesriktig. (6p)

(d) Vilken av skattningarna b 3 och b 1 ¨ ar effektivast? (2p)

(8)

L¨ osning

(a) Formelbladet ger E[ξ j ] = b/2 f¨ or j = 1, . . . , 5. Sats 5A ger d¨ arf¨ or E[ ¯ ξ] = b/2 och E[b 1 ] = b.

(b) Formelbladet och Sats 5A ger V (b 1 ) = b 2 /3.

(c) Direkt utr¨ akning ger E[b 2 ] = R b

0 xf (x)dx = 5b/6, vilket betyder att b 2 inte ¨ ar v¨ antev¨ ardesriktig. Sats 5A ger E[b 3 ] = b, s˚ a att b 3 ¨ ar v¨ antev¨ ardesriktig.

(d) Direkt utr¨ akning mha frekvensfunktionen ger V [b 3 ] < b 2 /3. Allts˚ a

¨

ar b 3 effektivare ¨ an b 1 .

12. Vi forts¨ atter att arbeta med datamaterialet som anv¨ andes i del 1, med med ytterligare en f¨ orklarande variabel som ¨ ar produkten av Typ och Speed.

(a) Ange fullst¨ andiga modellantaganden f¨ or analysen i tabell 2. Tyder residualanalysen i figur 1 p˚ a att modellantagandet ¨ ar rimligt?

Finns det n˚ agot i MINITAB utskrifterna i tabell 1 och tabell 2 som tyder p˚ a att den nya variabeln f¨ orb¨ attrat modellen i uppgift

8 p˚ a del 1? (4 p)

(b) Modellen som analyseras i tabell 1 kan uttryckas som tv˚ a linjer, som har samma lutning. Vilka ¨ ar de tv˚ a skattade linjerna? Skriv

ner formlerna f¨ or dessa. (2 p)

(c) Kan man p˚ a 5 % signifikansniv˚ a p˚ ast˚ a att linjerna har olika lut- ning, dvs att hastighetens effekt p˚ a livsl¨ angden ¨ ar olika f¨ or de tv˚ a olika typerna? F¨ or att besvara fr˚ agan skall du genomf¨ ora ett test som r¨ or n˚ agon av modellens parametrar. Testvariabel,

beslutsregel samt slutsats skall framg˚ a tydligt. (4 p)

Figur 1: Residualplottar vid regressionanalysen med Speed, Typ samt deras produkt.

L¨ osning

(a) Modellantagandet ¨ ar

Y i = β 0 + β 1 X 1,i + β 2 X 2,i +  i ,

d¨ ar Y = Liv, X 1 = Speed, X 1 = Typ och d¨ ar  1 , . . . ,  20 ∈ N (0, σ) ¨ ar

oberoende stokastiska variabler. Man skall om m¨ ojligt ange f¨ or vilka

v¨ arden p˚ a variablerna som modellen ¨ ar definiterad. Vi har X 2 = 0 eller

1 men i detta fall kan vi inte ange f¨ or vilka v¨ arden p˚ a X 1 modellen ¨ ar

definierad. Alla residualplottar ser bra ut. Det ¨ ar tveksamt om mod-

(9)

Tabell 2: Regression Analysis: Liv versus Speed; Typ; Typ·Speed The regression equation is

Liv = 1580 - 118 Speed + 155 Typ + 82,8 Speed x Typ

Predictor Coef SE Coef T P

Constant 1579,9 123,1 12,84 ?

Speed -117,71 24,86 -4,73 ?

Typ 155,1 150,0 1,03 ?

Speed x Typ 82,81 34,94 2,37 ?

S = 162,095 R-Sq = 84,9% R-Sq(adj) = 82,1%

Analysis of Variance

Source DF SS MS F P

Regression 3 2365111 788370 30,00 0,000 Residual Error 16 420395 26275

Total 19 2785506

f¨ or typ A och

Liv = 1753 − 11Speed + 202Typ f¨ or typ B.

(c) Modellantagandet ¨ ar

Y i = β 0 + β 1 X 1,i + β 2 X 2,i + β 3 X 1,i X 2,i +  i ,

d¨ ar Y = Liv, X 1 = Speed, X 1 = Typ och d¨ ar  1 , . . . ,  20 ∈ N (0, σ)

¨ ar oberoende stokastiska variabler.Vi vill testa H 0 : β 2 = 0 mot H 0 : β 2 6= 0. Testvariabel ¨ ar t-kvoten b 2 /s b

2

. Beslutsregel: F¨ orkasta H 0 om beloppet av t-kvoten ¨ ar st¨ orre ¨ an t 0.025 (16) = 2.12. Slutsats: H 0

f¨ orkastas p˚ a 5 5% signifikansniv˚ a.

References

Related documents

F¨ or betyg 5 kr¨ avs godk¨ ant p˚ a den f¨ orsta obligatoriska delen samt minst 23 po¨ ang fr˚ an den andra delen f¨ or ¨

Datamaterialet i Tabell 2, som best˚ ar av 38 observationer, beskriver hur antal inkomna ordrar (ordrar ×1000) f¨ or postorderf¨ oretag beror av upplagan p˚ a katalogen (uppl ×1000)

(a) Ber¨ akna sannolikheten att ingen av dom uppt¨ acker defekten.. (1p) (b) Ber¨ akna sannolikheten att exakt en av dom uppt¨

F¨ or betyg 4 kr¨ avs godk¨ ant p˚ a den f¨ orsta obligatoriska delen samt minst 13 po¨ ang fr˚ an den andra delen f¨ or ¨ overbetyg.. F¨ or betyg 5 kr¨ avs godk¨ ant p˚ a

F¨ or betyg 5 kr¨ avs godk¨ ant p˚ a den f¨ orsta obligatoriska delen samt minst 23 po¨ ang fr˚ an den andra delen f¨ or ¨

Avvikelsen mellan hans faktiska vikt och den vikt som v˚ agen visar ¨ ar normalf¨ ordelad med v¨ antev¨ arde noll och standardavvikelse σ = 0.05 kg.. Svara med den nedre

Vid bed¨ omningen av l¨ osningarna av uppgifterna i del 2 l¨ aggs stor vikt vid hur l¨ osningarna ¨ ar motiverade och redovisade. T¨ ank p˚ a att noga redovisa inf¨ orda

F¨ or godk¨ ant kr¨ avs minst 15 po¨ ang totalt och minst 4 po¨ ang p˚ a sannolikhetsteori- och statistik-delen vardera samt minst 3 po¨ ang p˚ a bioinfor-