1. I USA’s primärval har den demokratiske presidentkandidaten Barack Obama lyckats samla in stora mängder pengar till sin kampanj, där antalet donatorer nu överstiger en miljon personer. Antag att man vid en undersökning funnit att san- nolikheten att en donator gett sina pengar via ett onlinesystem är 30 %, och att 60 % av dem som donerat online är kvinnor. Man har också funnit att 40 % av dem som donerat pengar till kampanjen är kvinnor.
a) Vad är sannolikheten att en slumpmässigt utvald donator är en kvinna som donerat sina pengar via onlinesystemet? Ange ditt svar i procent med en
decimals noggrannhet. (2p)
b) Givet att en donator är en kvinna, hur stor är sannolikheten att hon inte do- nerat pengar via onlinesystemet? Ange ditt svar i procent med en decimals
noggrannhet. (2p)
2. På en förpackning med köttbullar anges att den innehåller 18-22 köttbullar. Erfa- renhet har visat att sannolikhetsfördelningen för antalet köttbullar i en slump- mässigt utvald förpackning kan beskrivas som
Antal 18 19 20 21 22
P(ξ = x) 0.1 0.1 0.5 0.2 0.1
a) Bestäm väntevärdet för antalet köttbullar i en slumpmässigt utvald för- packning. Ange ditt svar med två decimalers noggrannhet. (1p) b) Betrakta fem slumpmässigt utvalda förpackningar av ovanstående typ, vars
innehåll av köttbullar kan antas oberoende. Vad är sannolikheten att minst tre av dessa förpackningar innehåller minst 20 köttbullar? Ange ditt svar i procent med en decimals noggrannhet. (2p)
3. Livslängden hos bildröret i en äldre TV-apparat kan beskrivas av en exponenti- alfördelad stokastisk variabel ξ, där E[ξ] = 6 (enhet: år).
a) Bestäm sannolikheten att TV-apparatens bildrör är helt efter 8 år. Ange ditt svar i procent med en decimals noggrannhet. (2p) b) Bestäm standardavvikelsen för den sammanlagda livslängden hos nio bild-
rör av ovanstående typ. Ange ditt svar med två decimalers noggrannhet. (1p)
4. Ett flygbolag har efter en studie funnit att antalet passagerare som kommer till check-in vid en slumpmässigt utvald flygning på en viss linje kan approximeras av en normalfördelning med väntevärde 240 och standardavvikelsen 8.
a) Vilket är det passagerarantal vid check-in som överskrids med sannolikhe-
ten 10 % vid en slumpmässigt utvald flygning? Avrunda ditt svar uppåt till
a) Betrakta 25 oberoende flygningar. Vad är sannolikheten att det genom- snittliga antalet passagerare som dyker upp vid check-in på dessa är mind- re än 238? Ange ditt svar i procent med två decimalers noggrannhet. (2p)
5. En byggfirma köper cementsäckar av en grossist och är intresserade av den för- väntade vikten hos en säck. Man misstänker att metoden för att fylla säckarna har gett upphov till en slumpmässig variation hos vikten av en säck. Vikten hos var och en av säckarna kan antas komma från en kontinuerlig fördelning.
a) Grossisten vill använda ett konfidensintervall för medianen som mått på vad en cementsäck kan förväntas väga. Grossisten tar slumpmässigt ut nio cementsäckar som vägs. Konfidensintervallens undre gräns bestäms som vikten hos den näst lättaste av de vägda säckarna och intervallets övre gräns bestäms som vikten hos den näst tyngsta säcken. Bestäm konfidens- graden för det angivna intervallet. Ge svaret i procent med en decimals
noggrannhet. (2p) b) Byggfirman ansåg att den slumpmässiga variationen hos vikten av en ce-
mentsäck kunde beskrivas av en normalfördelning och menade därför att man skulle bestämma ett konfidensintervall för väntevärdet μ, utgående från normalfördelningsantaganden. De nio säckarna vägdes och man fann att medelvärdet var 16.9 kilo och standardavvikelsen skattades till 1.3 kilo.
Bestäm den undre gränsen i ett tvåsidigt 95 % konfidensintervall för μ. (2p)
6. En ingenjör vill hitta en modell som kan användas till att göra prognoser över beräkningstiden hos en mjukvaruapplikation som utför termodynamiska beräk- ningar. Till sitt förfogande har hon resultat från 30 körningar över beräkningstid, mängd indata samt antal ingående parametrar. Beräkningstiden (i minuter) ana- lyserades med hjälp av en multipel linjär regressionsanalys med mängd indata (i kilobyte) och antal parametrar som förklarande variabler. Delar av resultatet ges i tabell 1.
a) Bestäm den justerade förklaringsgraden för modellen. Ange ditt svar i pro-
cent med en decimals noggrannhet. (2p)
b) Bestäm ett tvåsidigt 90 % konfidensintervall för regressionsparametern som hör till variabeln mängd indata. Ange den övre gränsen med två de-
cimalers noggrannhet. (2p)
Tabell 1
The regression equation is
Beräkningstid = -2.350 + 0.802 Mängd_indata + 0.138 Antal_param
Predictor Coef SE Coef T P Constant -2,350 2,3039 -1,021 0,322 Mängd_indata 0,802 0,113 7,097 0,000 Antal_param 0.138 0,044 3,122 0,007
Tabell 1 (forts)
Analysis of Variance
Source DF SS MS F P Regression 2 343,51 171,75 51,21 0,000 Residual Error 27 90,579 3,354
Total 29 434,01
7. Det procentuella utbytet i en kemisk process ska studeras med tre tänkbara fak- torer. Ett fullständigt 2
3-försök gjordes, där varje försök utförs på två nivåer med fyra replikat i varje försökspunkt.
Tabell 2: Nivåer för de ingående faktorerna:
Faktor Låg nivå (–) Hög nivå (–)
Temperatur (T) 220
oC 250
oC
Reaktionstid (R) 150 sek 180 sek
Koncentration (K) 12 % 16 %
Försöksmatrisen i tabell 2 illustrerar nivåerna och resultaten vid det fullständiga faktorförsök som gjordes.
Tabell 3: Resultaten presenterade i standardordning:
T R K
Y s– – – 80.3 3.2
+ – – 77.2 2.7
– + – 79.0 2.8
+ + – 68.0 2.2
– – + 82.1 3.1
+ – + 81.3 2.2
– + + 84.0 2.5
+ + + 77.0 2.3
a) Skatta samspelseffekten för faktorerna T och K. Ange ditt svar med en de-
cimals noggrannhet. (1p)
b) Bestäm standardavvikelsen för en effekt dvs s
effekt.Ange ditt svar med
minst två decimalers noggrannhet. (2p)
Slut på del 1. Glöm inte att bifoga svarsbladet med tentan!
Tabell för svar till del 1.
Riv ut och lägg svarsbladet först i tentamen!
Namn...
Personnummer ...
Fråga Svar Poäng
a Sannolikhet 18.0 2
1
b Sannolikhet 55.0 2
a Väntevärde 20.10 1
2
b Sannolikhet 94.2 2
a Sannolikhet 26.4 2
3
b Standardavvikelse 18.00 1
a Antal 251 2
4
b Sannolikhet 10.6 2
a Konfidensgrad 96.1 2
5
b Undre gräns 15.90 2
a Juster. förklaringsgrad 77.7 2
6
b Övre gräns 1.00 2
a Samspelseffekt 1.6 1
7
b Standardavvikelse 0.94 2
Totalt antal poäng 25
Lycka till!
Vid bedömningen av lösningarna av uppgifterna i del 2 läggs stor vikt vid hur lösningarna är motiverade och redovisade. Tänk på att noga redovisa införda beteckningar och eventuella antaganden.
8. Efter att kvartsfinalerna lottades till UEFA’s Champions League har anklagelser om att lottningen varit manipulerad förekommit. Anledning är att en person på tidningen Liverpool Echo’s forum påstod att han visste vilka kvartsfinalparen skulle bli en halvtimme innan lottningen. Han redovisade den förhandsinforma- tion han påstod sig sitta på, och det visade sig att han hade rätt. Roma kommer att möta Manchester United, Schalke 04 möter Barcelona, Arsenal kommer att möta Liverpool och Fenerbahce kommer att stångas mot Chelsea. Lottningen till kvartsfinalerna är helt fri, vilket betyder att det inte finns några restriktioner då det gäller vilka lag som kan komma att mötas. Lottningen går till så att man väl- jer bollar ur en skål. Om lottningen går rätt till så är var och en av dessa bollar omärkta, men de innehåller respektive lags namn. Alltså finns totalt åtta bollar i skålen. Man drar en efter en tills ingen finns kvar. Ordningen spelar roll i så mån att lag ett som dras möter lag två, lag tre möter lag fyra och så vidare. Vil- ket lag som dras först inom respektive par styr endast vilket lag som börjar på hemmaplan, och är inte något som här behöver tas hänsyn till. Givet detta förfa- rande vid lottningen, vad är sannolikheten att gissa alla fyra kvartsfinaler rätt? (8p)
9. Acetylsalicylsyra kan användas för att förhindra att blodproppar bildas. Man ville undersöka om det fanns en skillnad i den maximala hopklumpningen av blodplättarna beroende på om en patient var rökare eller inte. För detta ändamål undersökte man åtta personer som inte var rökare, och åtta personer som upp- gav att de röker cirka tio cigaretter per dag. Varje försöksperson fick därefter äta den blodproppshämmande medicinen under en vecka, varefter den andelen (enhet: procent) maximal hopklumpning av blodplättar uppmättes.
Icke-rökare 25 29 22 26 32 31 29 32
Rökare 32 35 33 31 36 37 38 29
a) Antag att resultaten kan ses som observationer på oberoende normalförde- lade stokastiska variabler och att försökspersonerna valts ut oberoende av varandra. Ger detta resultat belägg för att det föreligger en påvisbar skill- naden i förväntad hopklumpning mellan de två olika grupperna? Besvara frågan genom att bestämma ett 95 % konfidensintervall. Redogör tydligt de antaganden smo görs, samt för dina slutsatser i ord. (8p) b) Antag att man i ett andra steg i undersökningen valt att fokusera enbart på
gruppen rökare. Man har då velat testa hypotesen att förväntad maximal
andel hopklumpning är 30, mot att den är högre än så. Man ställer alltså
som har felrisken 5 %, och styrkan 90 % då μ = 32. Hur många försökper- soner krävs minst för att detta ska vara uppfyllt? (6p)
10. Vid ett företag som tillverkar maskiner har man använt försökplanering för att undersöka en typ av förband, som kallas lockbolt. Man önskar att få en så hög hållfasthet som möjligt i förbandet, och valde i försöket att mäta hållfastheten i en försöksfixtur som utsattes för en cyklisk belastning. Vid varje försök använ- des ett automatiskt räkneverk som räknade antalet cykler till brott, varefter detta resultat logaritmerades. I Tabell 4 anges faktorerna och deras nivåer. I tabell 5 ges effektskattningar från ett fullständigt 2
4-försök, och resultatet av försöket ges i Tabell 6.
a) Ange vilka faktorer som är signifikanta med 5 % signifikansnivå, om du samtidigt antar att alla samspelseffekter av ordning tre och högre är för- sumbara. Ange också på vilken nivå respektive faktor ska hållas för att yt-
jämnheten ska maximeras. (5p)
b) Bestäm standardavvikelsen för resultatvariabeln Y. (3p)
Tabell 4: Faktorerna och deras respektive nivåer
Faktorer Låg nivå (–) Hög nivå (+)
Geometri, passning mellan nit och plåt (A) spel grepp Material, plåttyp (B) 1-skikt 2-skikt
Tätningsmedel (C) ja nej
Lastnivå (D) hög låg
Tabell 5. Effektskattningar
Term Effect Coef Constant 5,6138 A -0,4625 -0,2312 B 0,0850 0,0425 C 0,3025 0,1512 D 1,0675 0,5337 A*B 0,8450 0,4225 A*C -0,3775 -0,1887 A*D 0,6825 0,3412 B*C -0,2450 -0,1225 B*D 0,5850 0,2925 C*D -0,3375 -0,1688 A*B*C 0,0750 0,0375 A*B*D 0,4100 0,2050 A*C*D -0,1825 -0,0912 B*C*D 0,1450 0,0725 A*B*C*D -0,2600 -0,1300
Tabell 6: Resultat av försöket samt försöksplan
A B C D Y
– – – – 5,34
+ – – – 4,29
– + – – 5,13
+ + – – 4,28
– – + – 6,90
+ – + – 4,79
– + + – 5,24
+ + + – 4,67
– – – + 6,11
+ – – + 5,45
– + – + 5,44
+ + – + 7,66
– – + + 6,55
+ – + + 5,14
– + + + 6,05
+ + + + 6,78
Uppgift 8
De m¨ojliga ordningarna att lotta lagen i, fr˚an lag 1 till 8 kan skrivas som 8!
= 40320.
Om vi antar att vi lottat ordningen 1, 2, 3, 4, 5, 6, 7, 8 s˚a kommer lag 1 att m¨ota lag 2, lag 3 m¨ota lag 4 och s˚a vidare.
Vi sa att det spelar ingen roll inom vilken ordning lagen dras inom varje par, det finns tv˚a s¨att att ordna varje par. Det finns allts˚a 24s¨att att kasta om lagen inom varje par.
Dessutom s˚a spelar det ingen roll om lag 1 och 2 ¨ar det f¨orsta paret som dras. De kan lika g¨arna vara par nummer 2, 3 eller 4. Antalet m¨ojliga s¨att att ordna paren ¨ar s˚aledes 4! = 24.
Allts˚a, med hj¨alp av klassiska sannolikhetsdefinitionen, d¨ar vi dividerar antal gynnsamma utfall med antal m¨ojliga utfall b¨or vi d˚a f˚a att:
P(gissa r¨att kvartsfinalpar) = 248!4! = 1051
1
Uppgift 9
Vi har en situation med tv˚a stickprov.
ξ1, ξ2, ..., ξ8 ¨ar stokastiska variabler som beskriver andelen (i procent) hop- klumpning hos icke-r¨okare
η1, η2, ..., η8 ¨ar stokastiska variabler som beskriver andelen (i procent) hop- klumpning hos r¨okarna
vi har ¨anven att xi¨ar en observation p˚a ξi∈ N(μ1, σ), i = 1, 2, ..., 6 och yi ¨ar en observation p˚a ηj ∈ N(μ2, σ), j = 1, 2, ..., 6
Via ber¨aknigar kan vi erh˚alla
¯ x = 18P
xi = 28.25 sx=q
1 8−1
P(xi− ¯x)2= 3.615
P˚a samma s¨att f¨or v˚ara observationer p˚a y erh˚alls:
¯
y = 33.875 sy= 3.1367
Skatta standardavvikelsen σ genom f¨oljande:
spool=
qs2x+s2y
2 =
q3.6152+3.13672
2 = 3.384
Om vi skapar ett 95 % konfidensintervall f¨or differensen mellan v¨antev¨arden f˚ar vi att:
x − ¯¯ y ± t0.025(8 − 1 + 8 − 1) · spool·q
1
8+18 ≈ (−9.25; −2.00)
Svar: Vi kan med 95 % s¨akerhet p˚ast˚a att den f¨orv¨antade maximala andelen hopklumpning ¨ar mellan 2 och 9.25 procentenheter h¨ogre hos r¨okarna ¨an hos icke-r¨okarna.
2
Uppgift 10
a)
Vi antar att alla smaspelseffekter av ordning tre och h¨ogre ¨ar observationer p˚a en stokastisk variabel som ¨ar f¨ordelad enligt N(0, σef f ekt).
Vi skattar d˚a σef f ekt mha observationerna:
s = q
1 5
P(Zi− 0)2= 0.243
Vi vill f¨or varje effekt testa hypotesen:
H0: μef f ekt = 0 H1: μef f ekt 6= 0
som testvariabel anv¨ands effektskattningen, och vi f¨orkastar nollhypotesen om absolutbeloppet blir h¨ogre ¨an s*t(5) = 0.243*2.571 = 0.625
Detta ger oss att effekterna D, AB, och AD ¨ar signifikanta. Vi unders¨oker AB och AD i samspelsplottar f¨or att hitta vilka niv˚aer dessa b¨or h˚allas p˚a f¨or att maximera Y.
Vi f˚ar ur dessa att vi b¨or h˚alla A, B och D p˚a h¨og niv˚a.
b)
s2ef f ekt = V [Y(+)− ¯Y(−)] = V [Y(+)] + V [ ¯Y(−)] = s82 +s82 = 0.2432 => s =
√4 ∗ 0.2432= 0.486
3