Exempel från föreläsningar i Matematisk Statistik
2015
Födelsedagsparadoxen
Antag att k slumpmässigt utvalda individer
samlas i ett rum. Vad är sannolikheten att
åtminstone två av individerna har samma
födelsedag?
Laplaces röda och svarta kort
Antag att vi har tre kort. Ett är rött på båda sidorna, ett är svart på båda sidorna och ett är rött på ena och svart på andra sidan. Vi väljer ett kort slumpmässigt utan att titta och placerar det på ett bord. Om kortet är rött på ovansidan vad är då sannolikheten att den andra sidan också är röd?
HIV‐test
Enzyme immunoassay (EIA) tests are used to screen blood specimens for the presence of antibodies to HIV. Antibodies indicate the presence of the virus. The test is quite accurate but is not always correct.
Test positive Test negative Antibodies present 0.9985 0.0015
Antibodies absent 0.0060 0.9940
Suppose that 1% of a large population carries antibodies to HIV in their blood.
a) What is the probability that the test is positive for a randomly selected individual?
b) What is the probability that one individual have antibodies in his/her blood given that the test shows positive results.
Monty Hall‐paradoxen
I TV‐showen Let’s make a deal, ledd av Monty Hall, fick en
tävlande välja mellan tre luckor. Bakom en av luckorna finns en bil medan de resterande två innehåller getter. När tävlanden valt sin lycka öppnar Monty en av de övriga dörrarna och visar en
get.
Vilken av de två stängda dörrarna ska den tävlande välja för att maximera sannolikheten för att vinna bilen?
Vald dörr
St. Petersburg‐paradoxen
På ett kasino kan följande rättvisa spel spelas:
En pott börjar på 1 krona. Därefter singlas en slant, vid klave fördubblas potten. Vid krona avslutas spelet och spelaren vinner det som finns i potten.
Hur mycket är rimligt att betala för att vara med
och spela?
Ett företag ska köpa in komponenter till ett
system. Man kan välja mellan typ I (part om 30 st) eller typ II (parti om 100 st). Livslängden
antas vara exponentialfördelade där väntevärdet är 1.9 för typ I och 0.55 för typ II. Då en
komponent går sönder byts den genast ut mot
en ny. Vilket parti för att sannolikheten för drift i
50 tidsenheter ska vara så stor som möjligt?
En docent i matematisk statistik är på väg till jobbet och ska åka spårvagn mellan Redbergsplatsen och
Chalmers. På denna sträckan går två spårvagnar, 6:an och 8:an. Docenten anländer till hållplatsen
slumpmässigt. Låt X vara tiden tills en spårvagn från linje 6 kommer och Y vara tiden till en spårvagn från linje 8 kommer. Antag att både X och Y är likformigt föredelade mellan 0 och 10 samt att X och Y är
oberoende. Låt Z vara tiden tills en spårvagn från
någon av linjerna kommer .
a) Beräkna fördelningen för Z.
b) Beräkna den förväntade tiden docenten får vänta vid hållplatsen.
c) Hur mycket längre blir den förväntade tiden
docenten får vänta om linje 8 är indragen så att
endast spårvagnar från linje 6 går?
Exempel: Läkemedel
Mängden läkemedel i bloden hos 15 patienter har uppmätts.
5.14, 6.43, 5.83, 5.40, 6.92, 4.36, 6.29, 3.66, 5.83, 7.18, 5.29, 4.42, 7.83, 4.99, 4.90
Mätningarna antas vara oberoende och normalfördelade med parametrar μ och σ2.
1. Beräkna ett konfidensintervall för väntevärdet μ givet att σ=1. Konfidensgraden ska vara 95%.
2. Beräkna ett konfidensintervall för väntevärdet μ givet att σ2 är okänd. Konfidensgraden ska vara 95%.
3. Är antagandet om σ=1 rimligt?
Exempel: Cyanid
Vi har samlat in 72 prov av en förorenad jordmån (400g var) som vi har torkat och analyserat för cyanid.
Medelcyanidnivån i vårt stickprov är = 116 mg/kg och standardavvikelsen s = 80 mg/kg.
Beräkna ett konfidensintervall för mängden cyanid i jordmånen. Är den högre än 100 mg/kg? Använd 90%
konfidensgrad.
x
Exempel: Färg
Medeltorktiden för en typ av färg är 12 minuter. En ny
tillsats testas för att se om den förkortar torktiden. 16 ytor målas och medelvärdet av torktiden oberveras till = 11.1 och stickprovsvariansen till s2 = 0.36.
Bilda ett uppåt begränsat kondensintervall för den nya medeltorktiden med kondensgrad 0.99 under antagande om normalfördelning.
x
Exempel: Opinionsundersökning
I en politisk opinionsundersökning har man tillfrågat 2000 personer om partisympatier. 1087 svarar att de stöder
regeringen, resten oppositionen. Har regeringen majoritet bland väljarkåren?
1. Undersök med ett dubbelsidigt konfidensintervall.
2. Undersök med ett nedåt begränsat konfidensintervall.
Konfidensgrad 0.95.
Exempel: Agent Orange
Riskabelt höga halter av dioxinet 2,3,7,8‐TCDD i blodet och
fettvävnaden har observerats hos vietnamveteraner på grund av exponering för avlövningsmedlet Agent Orange. I en studie har man mätt mängden TCDD i blodplasma och fettvävnad hos tolv veteraner.
Veteran
TCDD‐nivå, fettvävnad
TCDD‐nivå, plasma
1 4.9 2.5
2 5.9 3.1
3 4.4 2.1
4 6.9 3.5
5 7.0 3.1
6 4.2 1.8
Veteran
TCDD‐nivå, fettvävnad
TCDD‐nivå, plasma
7 10.0 6.0
8 5.5 3.0
9 41.0 36.0
10 4.4 4.7
11 7.0 6.9
12 2.9 3.3
Kan vi från den här studien visa att det finns en systematisk skillnad mellan nivåer av TCDD i fettvävnad och blodplasma? Konfidensgrad 98%. Lämpligt normalfördelningsantagande får göras.
Exempel: pH
I en experimentell process för vattenrening måste man kontrollera att vattnet inte blir för surt eller basiskt (d.v.s.
håller ett neutralt pH på 7). Processen genomförs tolv gånger och pH‐värdet observeras varje gång.
8.25, 8.01, 6.41, 7.49, 8.29, 6.64, 8.11, 6.85, 8.05, 8.39, 9.06, 7.1
Antag att värdena är observationer från en normalfördelning med parametrar μ och σ2.
1. Vad kan vi säga om det verkliga pH‐värdet i vattnet?
2. Kan vi med ett test kontrollera om processen misslyckades med att hålla ett neutral pH på 7?
Exempel: Balanserat mynt
Vi vill undersöka om ett mynt är balanserat, d.v.s., att sannolikheten att få krona är 0.5. Vi genomför därför 10 slantsinglingar och beslutar att myntet är obalanserat om minst 9 av slantsinglingarna ger samma resultat.
1. Ställ upp nollhypotes och mothypotes. Vad har testet för nivå?
2. Beräkna styrkefunktionen.
Exempel: Potatischips
En fabrikant av potatischips påstår att innehållet i en typ av chipspåsar väger i genomsnitt minst 300 gram. För att
kontrollera detta vägdes 16 påsar varvid man fick ett
medelvärde på 295 gram. Anta att vikten kan anses vara normalfördelad med en standardavvikelse på 15 gram.
1. Testa om fabrikantens påstående är korrekt.
Signifikansnivån ska vara 5%.
2. Beräkna styrkan för en vikt på 290 gram.
Exempel: Värmeljus
En tillverkare av värmeljus påstår att brinntiden är 240 minuter. I ett test genomfört av en välkänd konsumenttidning ifrågasattes
påståendet och en statistisk undersökning genomfördes där
brinntiden studerades. Ett stickprov av 15 värmeljus valdes ut och brinntiden observerades. Stickprovsmedelvärdet beräknades till x 231. Brinntiden hos värmeljusen kan antas vara oberoende och normalfördelade med känd varians 171.
a) Formulera lämpliga hypoteser och fördelningsantaganden.
Genomför därefter ett enkelsidigt test för att testa om brinntiden är kortare än 240 minuter. Signifikansnivån ska vara 5%.
b) Beräkna p‐värdet för testet i (a).
c) Vad har testet i (a) för styrka om den sanna brinntiden är 235 minuter?
Exempel: Nytt läkemedel mot högt blodtryck
Vid ett kliniskt försök undersöks effekten av ett nytt blodtryckssänkande läkemedel. I studien deltar n = 17
individer och deras blodtryck mäts (i mmHg) före (x1, . . . , x17) samt 12 timmar efter (y1, . . . , y17) medicinering .
Före (x)
153.8, 171.3, 161.6, 160.6, 140.8, 169.0, 189.3, 184.9 176.4, 144.6, 147.6, 162.0, 160.9, 180.0, 182.6, 169.0, 171.6
Efter (y)
143.4, 173.4, 152.2, 138.6, 158.1, 149.0, 163.1, 145.5, 161.9, 152.8, 148.9, 171.7, 165.4, 171.3, 165.5, 151.0, 140.6
1. Använd ett teckentest för att testa om läkemedlet sänker blodtrycket. Signifikansnivån får max vara 5%.
Wilcoxons teckenrangtest
x y
0.79 1.73 1.83 1.65 1.14 2.19 1.27 1.39 1.86 1.41 1.72 1.48 2.09 1.22 1.90 1.41 d ‐1.07 0.32 0.12 0.17 ‐0.95 0.97 ‐0.63 ‐0.02 Stickprov
Beräkna rangen
|d| 1.07 0.32 0.12 0.17 0.95 0.97 0.63 0.02 0.02 0.12 0.17 0.32 0.63 0.95 0.97 1.07
8 4 2 3 6 7 5 1
Wilcoxons teckenrangtest
x y
0.79 1.73 1.83 1.65 1.14 2.19 1.27 1.39 1.86 1.41 1.72 1.48 2.09 1.22 1.90 1.41 d ‐1.07 0.32 0.12 0.17 ‐0.95 0.97 ‐0.63 ‐0.02 Stickprov
Beräkna rangen
|d| 1.07 0.32 0.12 0.17 0.95 0.97 0.63 0.02
8 4 2 3 6 7 5 1
s+=4+2+3+7=16
Exempel: Nytt läkemedel mot högt blodtryck
Vid ett kliniskt försök undersöks effekten av ett nytt blodtryckssänkande läkemedel. I studien deltar n = 17
individer och deras blodtryck mäts (i mmHg) före (x1, . . . , x17) samt 12 timmar efter (y1, . . . , y17) medicinering .
Före (x)
153.8, 171.3, 161.6, 160.6, 140.8, 169.0, 189.3, 184.9 176.4, 144.6, 147.6, 162.0, 160.9, 180.0, 182.6, 169.0, 171.6
Efter (y)
143.4, 173.4, 152.2, 138.6, 158.1, 149.0, 163.1, 145.5, 161.9, 152.8, 148.9, 171.7, 165.4, 171.3, 165.5, 151.0, 140.6
1. Använd ett teckentest för att testa om läkemedlet sänker blodtrycket. Signifikansnivån får max vara 5%.
2. Använd istället Wilcoxons rangteckentest för att testa om läkemedlet sänker blodtrycket. Signifikansnivån ska vara den samma, dvs max 5%.
Wilcoxons rangsummetest
x
y
2.42 4.87 4.07 6.29 ‐0.54 0.48 1.74 2.22
3.39 1.04 8.42 3.49 5.51 6.20 Stickprov 1
Sammanslaget stickprov
2.42 4.87 4.07 6.29 ‐0.54 0.48 1.74 2.22 3.39 1.04 8.42 3.49 5.51 6.20
6 10 9 13 1 2 4 5 7 3 14 8 11 12 wX=6+10+9+13+1+2+4+5=50
Stickprov 2
c
x y
wY=7+3+14+8+11+12=55
Exempel: Genuttryck i cancer
Mängden mRNA av genen p53 misstänks vara
sammankopplad med aggressiviteten hos en viss typ av tumörer. För att undersöka om så är fallet uppmättes mRNA‐nivån hos p53 hos 10 patienter med
den snälla formen (x1, . . . , x10) och hos 9 patienter med den aggressivare formen (y1, . . . , y9) av tumören.
Wilcoxons rangsumma för det första stickprovet beräknades till wx=138.
5.78 5.28 7.73 7.88 5.20 8.23 4.38 5.77 4.54 3.12 Stickprov 1 (m=10)
Stickprov 2 (n=9)
‐1.49 5.22 ‐5.20 0.21 ‐0.62 5.06 2.14 3.00 0.32
1. Använd Wilcoxons rangsummetest för att testa om det finns ett högre uttryck av p53 hos patienter med den
snällare cancerformen. Signifikansnivån får max vara 5%.
2. Beräkna p‐värdet för testet i 1.
Exempel: Töjning av tyg
Ett mellanlager av foder används mer och mer för att stödja yttre materiallager och för att förbättra form och fall hos olika klädtyper.
Följande data på töjning uppmättes för tyg från hög (H) och låg (L) kvalité.
H: 1.2 0.9 0.7 1.0 1.7 1.7 1.1 0.9 1.7 1.9 1.3 2.1 1.6 1.8 1.4 1.3 1.9 1.6 0.8 2.0 1.7 1.6 2.3 2.0
L: 1.6 1.2 1.1 2.1 1.5 1.3 1.0 2.6
Vi vill veta om det råder någon skillnad i töjbarhet mellan de båda kvaliteterna. Gör ett test på nivå 0.05. Normalfördelning för antas.
1. Standardavvikelserna för de två stickproven är σH=0.4 och σL=0.5.
2. Standardavvikelserna är olika och okända.
3. Standardavvikelserna antas vara lika men okända.
Exempel: EEG
EEG används för att mäta elektrisk aktivitet i hjärnan. Ett försök
utfördes på 20 kanadensiska fångar för att undersöka om isolering har en effekt på hjärnaktiviteten. De 20 fångarna delades slumpmässigt i två lika stora grupper där individer från den ena gruppen isolerades medan individerna i den andra grupper fick vara kvar i sina egna celler. Försöket varade i sju dagar.
Ej isolerade (xi) Isolerade (yi)
10.7 9.6
10.7 10.4
10.4 9.7
10.9 10.3
10.5 9.2
10.3 9.3
9.6 9.9
11.1 9.5
11.2 9.0
10.4 10.9
(frekvens av alpha‐vågor) Ej isolerade Isolerade
Exempel: Durra
Durra är en viktig gröda var kvalitet och utseende påverkas av
pigment i fruktämnet. Korsning mellan två arter av durra har gjorts för att producera plantor med röda frön. Plantorna med röda frön har
sedan självkorsats. Teoretiskt sett ska röda, gula och vita frön
förekomma i förhållandena 9:3:4. Följande data registrerades hos 368 självkorsade plantor:
Fröfärg Röd Gul Vit
Observerad
frekvens 195 73 100
Kan vi bekräfta den teoretiska fördelningen (Mendelsk nedärvning) eller stämmer inte vår teori? Signifikansnivå 0.05.
Exempel: Elektronrör
För att bestämma livslängden hos elektronrör används en
exponetialfördelning med väntevärde μ=1/λ. Livslängden (y) för 50 elektronrör observerades:
Kategori
Observerad frekvens
0≤y<20 14
20≤y<40 18
40≤y<60 7
60≤y<80 6
80≤y 5
1. Antag att μ=25. Testa med hjälp av ett χ2‐test om modellantagandet stämmer.
2. Uppskatta μ från datan och testa med hjälp av ett χ2‐test om modellantagandet stämmer.
Exempel: Kalcium och blodtryck
Man misstänker att mängden kalcium i blodplättar kan vara kopplat till blodtrycket. I en studie valdes 38 personer med normal blodtryck ut. För varje person mättes kalciumnivå (yi) och blodtryck (xi). Finns det ett linjärt samband?
Individ Kalcium (yi)
Blodtryck (xi)
1 95 84
2 112 109
3 122 96
4 88 98
5 87 92
6 104 87
7 90 86
8 110 93
9 100 103
10 122 95
11 126 101
12 102 90
13 122 100
Individ Kalcium (yi)
Blodtryck (xi)
14 96 87
15 135 109
16 130 97
17 127 100
18 125 112
19 103 84
20 112 93
21 120 100
22 107 91
23 107 92
24 112 93
25 93 87
26 80 105
Individ Kalcium (yi)
Blodtryck (xi)
27 88 87
28 86 78
29 107 90
30 78 87
31 88 82
32 121 97
33 125 99
34 130 94
35 107 95
36 115 100
37 110 90
38 126 108
“Life is good for only two things:
doing mathematics and teaching it.”
Siméon Denis Poisson
1781‐1840