• No results found

Ange ditt svar i procent med två decimalers noggrannhet. (2p) b) Antag att en enhet visat sig ha felen A och B. Vad är sannolikheten att den

N/A
N/A
Protected

Academic year: 2021

Share "Ange ditt svar i procent med två decimalers noggrannhet. (2p) b) Antag att en enhet visat sig ha felen A och B. Vad är sannolikheten att den "

Copied!
10
0
0

Loading.... (view fulltext now)

Full text

(1)

1. Ett företag som köper enheter från en underleverantör vet av erfarenhet att en viss andel av enheterna kommer att vara felaktiga. Sannolikheten är 20 % att fel A förekommer på en slumpmässigt vald enhet. För fel B är denna sannolikhet 15

% och fel C är sannolikheten 8 %. Felen uppkommer oberoende av varandra.

a) Bestäm sannolikheten att en slumpmässigt vald enhet har minst ett fel.

Ange ditt svar i procent med två decimalers noggrannhet. (2p) b) Antag att en enhet visat sig ha felen A och B. Vad är sannolikheten att den

även har fel C? Ange ditt svar i procent, utan decimaler. (1p) 2. En lärare som gillar kaffe glömmer ibland att gå tillbaka till fikarummet med

koppen han senast drack ur, vilket gör att flera tomma muggar ofta syns på hans skrivbord. En lång tids studie har visat att antalet muggar som finns på hans skrivbord klockan 14.00 en slumpmässigt vald dag kan beskrivas av följande sannolikhetsfördelning:

Antal 0 1 2 3

Sannolikhet 0.1 0.4 0.3 0.2

a) Bestäm standardavvikelsen för antalet muggar som står på hans bord klockan 14.00 en slumpmässigt vald dag. Ange ditt svar med två decima-

lers noggrannhet. (1p)

b) Betrakta en vanlig arbetsvecka, bestående av fem dagar. Vad är sannolik- heten att han i minst fyra av dessa dagar klockan 14.00 har färre än två muggar stående på bordet? Ange ditt svar i procent med en decimals nog-

grannhet. (2p)

3. Datorvane Daniel vet att tiden t (enhet: sekunder) det tar för ett visst program att starta på hans hemdator kan beskrivas av en fördelning med fördelningsfunk- tion:

⎩ ⎨

=

<

3 1

3 ) 0

(

0.2( 3) t e

t t

F t

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att star- ta? Ange ditt svar i procent med en decimals noggrannhet. (2p) b) Vilken är den tid t som programmet startar inom med 90 % sannolikhet?

Ange ditt svar i sekunder med två decimalers noggrannhet. (2p) 4. Tallar som växer på myrar, så kallade martallar, når vid en ålder av 50 år en höjd

över markytan som kan sägas vara normalfördelad med väntevärde μ

= 200 cm

och standardavvikelsen σ = 30 cm.

(2)

a) Vad är sannolikheten att höjden hos en slumpmässigt vald martall översti- ger 250 centimeter vid en ålder på 50 år? Ange ditt svar i procent med en

decimals noggrannhet. (2p)

b) Betrakta två slumpmässigt utvalda martallar som nått en ålder av 50 år, och anta att martallarnas höjd är oberoende av varandra. Vad är sannolik- heten att det skiljer mindre än 40 centimeter i höjd mellan de två träden?

Ange ditt svar i procent med två decimalers noggrannhet. (2p) 5. Metallpinnar som används till bilars fjädringssystem bör ha en diameter på 8.25

mm. För att undersöka om diametern kommer tillräckligt nära 8.25 mm togs ett stickprov om 7 metallpinnar och diametern hos dessa pinnar mättes. Stickprovet kan ses som observationer på en normalfördelad stokastisk variabel. Antag att man av erfarenhet kan anta att standardavvikelsen är känd där σ = 0.03 mm.

a) Bestäm den övre gränsen i ett dubbelsidigt 98 % konfidensintervall för me- tallpinnarnas förväntade diameter. Ange ditt svar med två decimalers nog-

grannhet. (2p)

b) Antag att man som ett led i att förbättra testet ovan kräver att bredden hos ett dubbelsidigt 98 % konfidensintervall inte får överstiga 0.02 mm. Vilket är det minsta antalet observationer som krävs för att tillgodose detta krav? (2p) 6. Ett företag som satsar pengar på reklamkampanjer för sina produkter ville hitta

en modell som visar effekten på försäljningen (Forsaljning, enhet: Mkr per år).

Som förklarande variabler valdes beloppet som spenderades på reklam (Kapital, enhet: Mkr per år) och kampanjer (Kampanj, enhet: antal per år). Resultatet av en enkel multipel linjär regressionsanalys baserat på observationer för 12 år ges i tabell 3.

a) Hur stor påverkan på den förväntade försäljningen har en ökning av kapita- let med en miljon kronor? Besvara frågan genom att skapa ett 95 % konfi- densintervall (dubbelsidigt). Ange den undre gränsen i ett sådant intervall

med två decimalers noggrannhet. (2p)

b) Bestäm den skattade residualspridningen för modellen. Ange ditt svar med

två decimalers noggrannhet. (1p)

Tabell 3

The regression equation is

Forsaljning = 218,79 + 1,139 Kapital – 1,862 Kampanj

Predictor Coef SE Coef T P Constant 218,79 13,1321 16.66 0.000 Kapital 1,139 0,303 3.754 0.005 Kampanj -1,862 0,756 -2.461 0.036

Analysis of Variance

Source DF SS MS F P

8.24 8.20 8.19 8.22 8.23 8.20 8.23

(3)

Regression 2 2435,5 1217,7 8,06 0,000 Residual Error 9 1360,2 ?

Total 11 3795,7

7. Kvicksilver försvinner från en lösning som förvaras i polypropylenflaskor ge- nom att ingå förening med upplöst tenn. Upptagningsförmågan av en standard- lösning av kvicksilver mättes vid två tillfällen för var och en av de åtta nivå- kombinationerna

Tabell 1: Nivåer för de ingående faktorerna:

Faktor Låg nivå (–) Hög nivå (–)

A: Omskakning av flaska Nej Ja

B: Rengöring av flaska En gång Två gånger

C: Lagringstid 1 timme 10 timmar

Försöksmatrisen i tabell 2 illustrerar nivåerna och resultaten vid det fullständiga faktorförsök som gjordes.

Tabell 2: Resultaten presenterade i standardordning:

Försök nr A B C

Y i

s

i

1 – – – 98 1.41

2 + – – 82 2.00

3 – + – 96 1.73

4 + + – 83 1.41

5 – – + 77 1.00

6 + – + 48 1.41

7 – + + 81 2.00

8 + + + 51 1.41

a) Skatta samspelseffekten för A och C. Ange ditt svar med en decimals nog-

grannhet. (1p) b) Skatta standardavvikelsen för en effekt, dvs s

effekt

. Ange ditt svar med två

decimalers noggrannhet. (2p)

c) Man vill för var och en av effekterna testa H

0

: μ

effekt

= 0 mot H

1

: μ

effekt

≠ 0,

och beslutar sig för att arbeta med en felrisk på 5 %. Som testvariabel an-

vänder man den standardiserade effekten, som ges av kvoten mellan en

skattad effekt och effektens skattade standardavvikelse. Bestäm den kon-

stant ur t-fördelningen som används som kritisk gräns i testet. (1p)

(4)

Tabell för svar till del 1.

Riv ut och lägg svarsbladet först i tentamen!

Namn...

Personnummer ...

Fråga Svar Poäng

a Sannolikhet 37.44 2

1

b Sannolikhet 8 1

a Standardavvikelse 0.92 1

2

b Sannolikhet 18.8 2

a Sannolikhet 54.9 2

3

b Tid 14.51 2

a Sannolikhet 4.8 2

4

b Sannolikhet 82.6 2

a Övre gräns 8.25 2

5

b Antal observationer 49 2

a Undre gräns 0.45 2

6

b Residualspridning 12.29 1

a Samspelseffekt -7.5 1

b Standardavvikelse 0.79 2

7

c Testvariabel 2.306 (och -2.306) 1

Totalt antal poäng 25

Lycka till!

(5)

Vid bedömningen av lösningarna av uppgifterna i del 2 läggs stor vikt vid hur lösningarna är motiverade och redovisade. Tänk på att noga redovisa införda beteckningar och eventuella antaganden.

8. En IT-avdelning på ett företag vill studera belastningen på fyra av deras servrar.

Man vet att antalet anrop till var och en av servrarna som kommer in under en 0.5 sekunders period beskrivs av en Poissonfördelning med väntevärde 2.5.

Servrarna tar emot anropen oberoende av varandra. För att få ett mått på belast- ningen har man valt att använda sig av ett formulär där man noterar varje gång alla de fyra servrarna fått ta mot minst tre anrop per server under en 0.5 sekun- ders period. Antag att man studerar tio tidsperioder på 0.5 sekunder och att anta- let anrop under var och en av tidsperioderna kan antas vara oberoende. Bestäm

sannolikheten att högst två noteringar finns på formuläret. (10p)

9. En komponent tillverkas av pulvermetall. Kompaktering av pulvermetallen sker i en press under högtryck. Ett problem som uppstår under denna process är den höga friktionen mellan partiklarna och verktygsväggen. För att minska denna använder man ett smörjmedel. Man vill göra en jämförelse mellan två olika ty- per av smörjmedel. Man väljer ut 12 likadana verktyg och fördelar hälften till vardera typ av smörjmedel. En mätning av friktionskoeffecienten gav följande resultat:

Smörjmedel A 0.0190 0.0188 0.0167 0.0164 0.0186 0.0182 Smörjmedel B 0.0175 0.0194 0.0201 0.0187 0.0192 0.0171 Kan man utgående från detta påstå att det är skillnad i genomsnittlig friktion för de båda typerna av smörjmedel? I så fall hur stor är skillnaden? Besvara frågor- na genom att beräkna och tolka ett lämpligt 90 % konfidensintervall under rim- liga normalfördelningsantaganden, som skall framgå i lösningen av uppgiften.

Tolka resultatet av konfidensintervallet i ord. (8p)

10. I USA genomfördes en undersökning med syftet att studera hur kostnaden (enhet: dollar) för elkonsumtion under ett år kan förklaras med hjälp av ett antal variabler. Man undersökte antal personer i hushållet (enhet: antal), boyta (enhet:

kvadratfot) hos 34 utvalda hushåll. Resultatet från en multipel linjär regres- sionsanalys ges i tabell 4.

a) Ange de modellantaganden som gäller för den skattade modellen i tabell 4. Tolka regressionskoeffecienterna i ord. Utför även ett hypotestest för att undersöka om variabeln Boyta bör ingå i modellen. Hypoteser, beslutsva-

riabel samt slutsatser ska tydligt framgå. (5p) b) Ett 95 % konfidensintervall för de förväntade kostnaden av elkonsumtio-

nen då antalet personer i hushållet var 4 och boytan 1200 kvadratfot var

(6)

[301.9, 492.7]. Bestäm utgående från detta ett 95 % prognosintervall för motsvarande givna värden på antal personer per hushåll och boyta . Tolka

prognosintervallet i ord. (4p)

c) Figur 1 visar en av de residualplotter som ska göras för att undersöka rim- ligheten i de modellantaganden som gäller för vår skattade modell. Vilken del i modellantagandet undersöks med hjälp av denna plot? Bör man vara misstänksam mot att något i modellantagandet inte stämmer? I så fall vad?

Redogör för ytterligare två residualplotter som bör göras och redogör för

vilka delar av modellantagandet man undersöker med dessa plotter. (3p)

Tabell 4:

Regression Analysis: Elkostnad versus Personer; Boyta

The regression equation is

Elkostnad = - 256 + 42,0 Personer + 0,404 Boyta

Predictor Coef SE Coef T P Constant -255,95 70,14 -3,65 0,001 Personer 42,03 16,68 2,52 0,017 Boyta 0,40429 0,03615

S = 133,894 R-Sq = 85,0% R-Sq(adj) = 84,0%

Analysis of Variance

Source DF SS MS F P Regression 2 3145915 1572957 87,74 0,000 Residual Error 31 555753 17928

Total 33 3701668

Figur 1:

Figur 1:

7 6

5 4

3 2

1 400 300 200 100 0 -100 -200 -300

Personer

Residuals Versus Personer

(response is Elkostnad)

(7)

Uppgift 8

Vi vet att antalet anrop som kommer in till server kan kan beskrivas av en Poissonf¨ordelning med v¨antev¨arde 2.5.

Allts˚a b¨or g¨alla f¨or alla fyra servrar, i=1,...4:

P(minst tre anrop till server i) = 1 - P(h¨ogst tv˚a anrop server i) = 0.46 P˚a grund av oberoendet kan vi sedan g˚a vidare och definiera:

ξ =”antal servar som tar mot minst tre anrop”, d¨ar ξ ∈ Bin(4, 0.46) P(alla servar tar emot minst 3 anrop) = P(ξ = 4) = 0.0433

˚Aterigen, vi har oberoende tidsperioder vilket g¨or att vi nu kan definiera ytterligare en stokastisk variabel som

η =”antalet tidsperioder med notering p˚a formul¨ar”, d¨ar η ∈ Bin(10, 0.0433).

P(h¨ogst tv˚a noteringar p˚a formul¨ar)=P(η ≤ 2) = 0.9922

Svar: Sannolikheten ¨ar 99.22% att det finns h¨ogst tv˚a noteringar p˚a for- mul¨aret.

1

(8)

Uppgift 9

Vi har en situation med tv˚a stickprov.

ξ1, ξ2, ..., ξ6¨ar stokastiska variabler som beskriver friktionskoeffecienten hos sm¨orjmedel A

η1, η2, ..., η6¨ar stokastiska variabler som beskriver friktionskoeffecienten hos sm¨orjmedel A

vi har ¨anven att xi¨ar en observation p˚a ξi∈ N(μ1, σ), i = 1, 2, ..., 6 och yi ¨ar en observation p˚a ηj∈ N(μ2, σ), j = 1, 2, ..., 6

Via ber¨aknigar kan vi erh˚alla

¯ x = 16P

xi= 0.018 sx=q

1 6−1

P(xi− ¯x)2= 0.00112

P˚a samma s¨att f¨or v˚ara observationer p˚a y erh˚alls:

¯

y = 0.01867 sy = 0.00116

Skatta standardavvikelsen σ genom f¨oljande:

spool=

qs2x+s2y

2 =

q0.001122+0.001162

2 =

Om vi skapar ett 90% konfidensintervall f¨or differensen mellan v¨antev¨arden f˚ar vi att:

x − ¯¯ y ± t0.05(6 − 1 + 6 − 1) · spool·q

1

6+16 ≈ (−0, 001908; 0, 000475) Svar: Vi kan inte med 90 % s¨akherhet p˚avisa en skillnad i f¨orv¨antad frik- tionskoeffecient mellan de tv˚a sm¨orjmedlen, detta p˚a grund av att nollan ing˚ar i intervallet.

2

(9)

Uppgift 10

a)

Modellantagande: Yi= β0+ β1X1i+ β2X2i+ εi , i = 1, 2, ..., 34

εi∈ N(0, σ) , i = 1, 2, ..., 34, ε1, ε2, ..., ε34oberoende stokastiskavariabler Yi: Elkostnad

X1i : Personer X2i : Boyta

Vi utf¨or ett hypotestest f¨or att testa variabeln Boyta genom f¨oljande:

H0: β2= 0 H1: β2 6= 0 t = bs2

2 = 0.404290.03615 = 11.18

Vi har ingen signifikansniv˚a given, men v¨aljer 5 % som en standard. Som kritisk gr¨ans blir i s˚a fall t ≈ 2.042 (g¨aller f¨or 30 frihetsgrader)

I v˚art fall ¨ar v¨ardet p˚a v˚ar testvariabel s˚a h¨ogt att vi kan f¨orkasta nollhy- potesen med en v¨aldigt l˚ag felrisk. Oavsett vilken felrisk som valts f¨or vi komma fram till att nollhypotesen i detta fall b¨or f¨orkastas. Vi kan allts˚a p˚ast˚a att boy- tan har en p˚averkan elkostnaden, och att sambandet ¨ar positivt, dvs ¨okad boyta ger ¨okad elkostnad.

b)

Ett 95 % konfidensintervall i ett hush˚all med fyra personer och 1200 kvadrat- fots boyta var givet som [301.9, 492.7]. Vi ska utifr˚an detta best¨amma ett prognosintervall.

Mittpunkten i intervallet ges av en punktskattning f¨or Elkostnaden vid dessa parametrar, dvs

o= −255.95 + 42, 03 ∗ 4 + 0, 40429 ∗ 1200 = 397.3

Vi har d˚a att felmarginalen i intervallet kan uttryckas som 492.7-397.3 = 95.4

Allts˚a b¨or tsyˆo= 95.4.

T-konstanten b¨or ha 31 frihetsgrader, men eftersom vi endast har tabell fram till 30 frihetsgrader f˚ar vi approximera den till 2.042. Detta ger f¨oljaktiglen att standardavvikelsen syˆo = 46.72

Ett 95% prediktionsintervall ges av uttrycket:

3

(10)

o± tspr

D¨ar spr=q

s2e+ s2yˆo =√

133.8942+ 46.722= 141.85

D˚a f˚as ett 95% prognosintervall som [107.6 , 687.0]. Vi kan allts˚a med 95

% s¨akerhet p˚ast˚a att en ny obsveration av elkonstaden f¨o rett huh˚all med fyra personer och en boyta p˚a 1200 kvardrotfot kommer ligga inom intervallet ovan.

c)

Med hj¨alp av denna del av modellantagandet unders¨oks dels det linj¨ara beroendet mellan variabeln som h¨or till ”personer” och resultatvariabeln Y, men ¨aven feltermernas spridning och oberoende. Oberoende ser vi inget som mots¨ager, men d¨aremot kan man ifr˚agasatta om vi i detta fall har den konstanta varians som vi antar. F˚a m¨atv¨arden f¨or fyra pesoner och upp˚at g¨or det dock lite sv˚art att dra tv¨ars¨akra slutsatser.

Ovriga residualplotter som b¨¨ or g¨oras ¨ar mot de predikterade Y-v¨arden och mot vairabeln boyta. D¨ar unders¨oks samma delar av modellantagandet som ovan. Dessutom kan vi ocks˚a anv¨anda oss av en normalf¨ordelningsplot av resid- ualerna f¨or att unders¨oka om feltermerna ser ut att vara obsverationer p˚a en normalf¨ordelad stokastisk variabel eller inte.

4

References

Related documents

Den kategoriseringsprocess som kommer till uttryck för människor med hög ålder inbegriper således ett ansvar att åldras på ”rätt” eller ”nor- malt” sätt, i handling

Det är således angeläget att undersöka vilket stöd personalen är i behov av, och på vilket sätt stöd, till personal med fokus på palliativ vård till äldre personer vid vård-

Den första slutsatsen från den empiriska analysen är att det bland eleverna i undersökningen finns ett stöd för demokrati i allmänhet och, även mer specifikt,

Detta anser vi vara överförbart till hur officerare inom Försvarsmakten upplever sin yrkesidentitet, och därför har vi valt att använda oss av dessa artiklar i vår

Utifrån studiens syfte och frågeställningar, så kommer jag undersöka hur den konsumtionslösa perioden påverkar mig som individ i förhållande till min identitet samt vad

rör av ovanstående typ. Ange ditt svar med två decimalers noggrannhet. Ett flygbolag har efter en studie funnit att antalet passagerare som kommer till check-in vid en

grannhet. Det har visat sig att varvtalet vid tomgångskörning hos en slumpmässigt vald Volvo 744 av 1990 års modell kan beskrivas av en normalfördelning med vänte- värde μ =

I testgruppen fanns nu åtta elever med rätt svar på första frågan, vilket visade en ökning med fem elever från förtestet.. I kontrollgruppen fanns nio