Avd. Matematisk statistik Tisdagen den 11 januari 2005
Tentamen f¨ or kursen Statistik f¨ or naturvetare Tisdagen den 11 januari 2005 9 - 14
Examinator: Anders Bj¨orkstr¨om, tel. 16 45 54, bjorks@math.su.se
Till˚atna hj¨alpmedel: Levine, Ramsey & Smidt: Applied Statistics for Engi- neers and Scientists. Egna anteckningar. Minir¨aknare.
L¨osningar finns p˚a kursens hemsida (www.math.su.se/matstat/und/statfnat) fr. o. m. skrivtidens slut.
˚Aterl¨amning: Fredag 14/1 2005 kl 16.00. Rum 312, hus 6. Den som vill veta sitt resultat tidigare kan l¨amna uppgift om sin epostadress tillsammans med l¨osningarna.
Krav f¨or godk¨ant: F¨or betyget godk¨ant kr¨avs minst ˚atta po¨ang inklusive maximalt fyra po¨ang fr˚an inl¨amningsuppgifterna. F¨or betyget v¨al godk¨ant kr¨avs ˚atta po¨ang bland de tolv som ¨ar m¨ojligt att f˚a p˚a skrivningen. Resone- mang skall vara klara och tydliga att f¨olja.
————————————————
Uppgift 1
En grupp doktorander har m¨att ett antal r¨avhannar i V¨astsverige. I in- stitutionens rapportserie skriver de sedan att ett 95% konfidensintervall f¨or r¨avhannars medell¨angd (inklusive svans) str¨acker sig fr˚an 110.4 cm till 134.2 cm. Deras professor tolkar detta s˚ah¨ar: ”Med 95 % sannolikhet ¨ar en r¨avhanne i V¨astsverige mellan 110.4 cm och 134.2 cm”.
a) ¨Ar detta en riktig tolkning? Om inte, f¨orklara tydligare vad doktoran-
dernas resultat inneb¨ar. (1 p)
b) Vid n¨armare granskning visar sig unders¨okningen ha omfattat sju r¨avhan- nar, med f¨oljande l¨angder (i cm, inkl. svans): 123, 144, 105, 99, 120, 136, 129.
Om man ber¨aknar ett symmetriskt 95% konfidensintervall f¨or medell¨angden av en r¨avhanne utifr˚an dessa data s˚a f˚ar man inte riktigt samma resultat som doktoranderna fick. R¨akna ut ett riktigt konfidensintervall och f¨orklara vad doktoranderna troligen har gjort f¨or fel. (1 p)
Statistik f¨or naturvetare, Tisdagen den 11 januari 2005 2
Uppgift 2
P˚a ett mejeri vill man unders¨oka om tv˚a paketeringsmaskiner A och B
¨
ar likv¨ardiga fr˚an hygiensk synpunkt. Maskin A ¨ar av en traditionell typ, medan B ¨ar en nyutvecklad variant som p˚ast˚as ge l¨agre bakteriehalter i mj¨olken. Man tar p˚a m˚af˚a ut 24 paket ur vardera maskinens produktion och m¨ater halten av en viss bakterie. Det bifogade Excel-bladet visar m¨angden bakterier per volymsenhet. Man kan t¨anka sig tv˚a s¨att att analysera dessa data: Tv˚asampel t-test eller Wilcoxons rangsummetest. Bilagorna visar en datorutskrift av resultatet.
a) Avg¨or, b˚ade f¨or tv˚asampel t-testet och Wilcoxontestet, huruvida det kan anses s¨akerst¨allt p˚a niv˚an 5 % att maskin B ger l¨agre bakteriehalter. (1 p) b) Vilket av de b˚ada testen ¨ar l¨ampligast att utf¨ora h¨ar? (1 p)
Uppgift 3
Vid enkel linj¨ar regression talar man dels om prediktionsintervall f¨or kom- mande observationer, dels om konfidensintervall f¨or den “sanna” regressions- linjens y-v¨arde. B˚ada typerna av intervall f¨oruts¨atter att ett x-v¨arde ¨ar specificerat. N¨ar antalet observationer ¨okar blir b˚ada intervallen kortare.
a) Den ena typen av intervall kan g¨oras hur kort som helst, bara antalet observationer blir tillr¨ackligt stort. Vilken av typerna g¨aller det? Varf¨or kan inte den andra typen av intervall blir hur kort som helst? (Svara med en intuitiv motivering, inte med en h¨anvisning till en formel). (1 p) b) I bilagan redovisas en regressionsanalys baserad p˚a n = 20 observationer.
Man skall g¨ora en observation till, och man vill d˚a v¨alja x-v¨ardet s˚a att prediktionsintervallet blir s˚a kort som m¨ojligt. Best¨am x och ber¨akna ett
symmetriskt 95% prediktionsintervall. (1 p)
Uppgift 4
Vid en farmakologisk institution genomf¨ordes en studie f¨or att j¨amf¨ora olika
¨
amnen som lindrar irriterande kl˚ada. Fem olika medel j¨amf¨ordes i studi- en. Tio frivilliga f¨ors¨okspersoner deltog, alla m¨an i ˚aldern 20 - 30 ˚ar. Varje f¨ors¨okperson utsattes f¨or en behandling per dag och det antogs att inga be- handlingar l¨amnar kvarst˚aende effekter till n¨asta dag. Behandlingen gick till s˚a att f¨ors¨okspersonen fick en injektion av ett av ¨amnena, varefter han ut- sattes f¨or ett irriterande preparat. Med hj¨alp av en klocka registerades hur l¨ange kl˚adan varade. F¨orutom de fem aktiva ¨amnena utsattes f¨ors¨oksper- sonerna f¨or en injektion av ett placebopreparat, och en kontroll gjordes d˚a personen inte fick n˚agon behandling alls. Tidsf¨oljden mellan behandlingarna
randomiserades.
Resultaten framg˚ar av f¨oljande tabell, som anger hur m˚anga sekunder kl˚adan varade:
Ingen Papa- Amino- Pento- Tripelen-
Person behandling Placebo verine Morphine phylline barbital namine
BG 174 263 105 199 141 108 141
JF 224 213 103 143 168 341 184
BS 260 231 145 113 78 159 125
SI 255 291 103 225 164 135 227
BW 165 168 144 176 127 239 194
TS 237 121 94 144 114 136 155
GM 191 137 35 87 96 140 121
SS 100 102 133 120 222 134 129
MU 115 89 83 100 165 185 79
OS 189 433 237 173 168 188 317
Medelv¨arde 191.0 204.8 118.2 148.0 144.3 176.5 167.2 Som inledning till den statistiska bearbetningen uppr¨attar man f¨oljande
ANOVA-tabell:
Variationsk¨alla Antal frihets- Kvadrat- MKVSUM F
grader summa
Mellan behandlingar 53013
Mellan f¨ors¨okspersoner 103280
Residualer 167130
Totalt
Forts¨att den statistiska analysen och tala om vilka slutsatser man kan dra. (3 p)
Uppgift 5, alternativ I
F¨or att unders¨oka hur valet av l¨osningsmedel och koncentrationen av en katalysator inverkade p˚a bildandet av en biprodukt vid en syntes pr¨ovades tv˚a g˚anger alla kombinationer av tv˚a olika l¨osningsmedel A och B och tv˚a koncentrationer av katalysatorn i f¨oljande experiment.
L¨osningsmedel Katalysator M¨angd bildad biprodukt vid tv˚a ober. upprepn.
A 3% 8.0, 7.0
B 3% 9.0, 9.0
A 5% 11.0, 12.0
B 5% 16.0, 14.0
Statistik f¨or naturvetare, Tisdagen den 11 januari 2005 4
a) Skatta faktorernas huvudeffekter och samspelseffekten. (1 p) b) Skatta os¨akerheten i de enskilda m¨atv¨ardena, i form av standardavvikelsen f¨or f¨ors¨oksfelet. Ange skattningens antal frihetsgrader. (1 p) c) F¨oruts¨att att f¨ors¨oksfelet ¨ar normalf¨ordelat. Ber¨akna konfidensintervall med 95% konfidensgrad f¨or vardera medeleffekten och f¨or samspelseffekten.
Avg¨or vilka effekter som ¨ar signifikant s¨akerst¨allda p˚a 5% signifikansniv˚a. (1 p)
Uppgift 5, alternativ II
a) Ett livsmedelsf¨oretag ¨overv¨ager att b¨orja tills¨atta en konsistensgivare till sin jordgubbssylt, eftersom marknadsunders¨okningar tyder p˚a att kunderna
¨
onskar en fastare konsistens. F¨oretaget vill dock f¨ors¨akra sig om att kon- sistensgivaren inte p˚averkar smaken hos sylten. D¨arf¨or genomf¨ors f¨oljande experiment: Ett antal f¨ors¨okspersoner f˚ar smaka p˚a tre prover av sylten, varav ett ¨ar behandlat med konsistensgivare och tv˚a ¨ar obehandlade. Per- sonen f˚ar ange vilket av de tre proverna som avviker mest i smak. Sextio personer deltar i unders¨okningen, och 28 av dem uppger att det behand- lade provet har den mest avvikande smaken. Kan det anses s¨akerst¨allt att konsistensgivaren f¨or¨andrar smaken hos sylten? (2 p) b) I ett inslag i Rapport den 23 nov 2004 ber¨attades att det i Jokkmokk under ˚aret hade f¨otts 20 % fler barn ¨an normalt. ”Det beror p˚a kommunens nyinf¨orda bel¨oningssystem, som premierar familjer med m˚anga barn”, f¨or- klarade en bel˚aten kommunpolitiker. I inslaget framgick ocks˚a att det totala antalet nyf¨odda under ˚aret var 42 (mot normalt 35, s˚aledes).
Betrakta en fiktiv kommun vars folkm¨angd ¨ar s˚a stor att det brukar f¨odas 35 barn per ˚ar, och antag att varje kvinna i fertil ˚alder best¨ammer om hon ska f¨oda barn under ˚aret eller l˚ata bli, oberoende av de ¨ovrigas val. Om det r˚akar f¨odas 42 barn ett visst ˚ar, finns det d˚a sk¨al att ¨overhuvudtaget s¨oka efter n˚agon annan f¨orklaring ¨an slumpen? Motivera svaret. (1 p)
————————————————
Lycka till!