Exempel från föreläsningar i Matematisk Statistik

Full text

(1)

Exempel från föreläsningar i  Matematisk Statistik 

2015

(2)

Födelsedagsparadoxen

Antag att k slumpmässigt utvalda individer 

samlas i ett rum. Vad är sannolikheten att 

åtminstone två av individerna har samma 

födelsedag?

(3)

Laplaces röda och svarta kort

Antag att vi har tre kort. Ett är rött på båda sidorna, ett är svart på båda sidorna och ett är rött på ena och svart på andra sidan. Vi väljer ett kort slumpmässigt utan att titta och placerar det på ett bord. Om kortet är rött på ovansidan vad är då sannolikheten att den andra sidan också är röd?

(4)

HIV‐test

Enzyme immunoassay (EIA) tests are used to screen blood specimens for the presence of antibodies to HIV. Antibodies indicate the presence of the virus. The test is quite accurate but is not always correct.

Test positive Test negative Antibodies present 0.9985 0.0015

Antibodies absent 0.0060 0.9940

Suppose that 1% of a large population carries antibodies to HIV in their blood.

a) What is the probability that the test is positive for a randomly selected individual?

b) What is the probability that one individual have antibodies in his/her blood given that the test shows positive results.

(5)

Monty Hall‐paradoxen

I TV‐showen Let’s make a deal, ledd av Monty Hall, fick en 

tävlande välja mellan tre luckor. Bakom en av luckorna finns en  bil medan de resterande två innehåller getter. När tävlanden valt  sin lycka öppnar Monty en av de övriga dörrarna och visar en 

get.

Vilken av de två stängda dörrarna ska den tävlande välja för att  maximera sannolikheten för att vinna bilen?

Vald dörr

(6)

St. Petersburg‐paradoxen

På ett kasino kan följande rättvisa spel spelas:

En pott börjar på 1 krona. Därefter singlas en  slant, vid klave fördubblas potten. Vid krona  avslutas spelet och spelaren vinner det som  finns i potten.

Hur mycket är rimligt att betala för att vara med 

och spela?

(7)

Ett företag ska köpa in komponenter till ett 

system. Man kan välja mellan typ I (part om 30  st) eller typ II (parti om 100 st). Livslängden 

antas vara exponentialfördelade där väntevärdet   är 1.9 för typ I och 0.55 för typ II. Då en 

komponent går sönder byts den genast ut mot 

en ny. Vilket parti för att sannolikheten för drift i 

50 tidsenheter ska vara så stor som möjligt?

(8)

En docent i matematisk statistik är på väg till jobbet  och ska åka spårvagn mellan Redbergsplatsen och 

Chalmers. På denna sträckan går två spårvagnar, 6:an  och 8:an. Docenten anländer till hållplatsen 

slumpmässigt. Låt X vara tiden tills en spårvagn från  linje 6 kommer och Y vara tiden till en spårvagn från  linje 8 kommer. Antag att både X och Y är likformigt  föredelade mellan 0 och 10 samt att X och Y är 

oberoende. Låt Z vara tiden tills en spårvagn från 

någon av linjerna kommer .

(9)

a) Beräkna fördelningen för Z.

b) Beräkna den förväntade tiden docenten får vänta  vid hållplatsen.

c) Hur mycket längre blir den förväntade tiden 

docenten får vänta om linje 8 är indragen så att 

endast spårvagnar från linje 6 går?

(10)

Exempel: Läkemedel

Mängden läkemedel i bloden hos 15 patienter har  uppmätts.

5.14, 6.43, 5.83, 5.40, 6.92, 4.36, 6.29, 3.66, 5.83, 7.18,  5.29, 4.42, 7.83, 4.99, 4.90

Mätningarna antas vara oberoende och normalfördelade  med parametrar μ och σ2.

1. Beräkna ett konfidensintervall för väntevärdet μ givet att  σ=1. Konfidensgraden ska vara 95%.

2. Beräkna ett konfidensintervall för väntevärdet μ givet att  σ2  är okänd. Konfidensgraden ska vara 95%.

3. Är antagandet om σ=1 rimligt?

(11)
(12)

Exempel: Cyanid

Vi har samlat in 72 prov av en förorenad jordmån (400g var)  som vi har torkat och analyserat för cyanid. 

Medelcyanidnivån i vårt stickprov är      = 116 mg/kg och  standardavvikelsen s = 80 mg/kg. 

Beräkna ett konfidensintervall för mängden cyanid i  jordmånen. Är den högre än 100 mg/kg? Använd 90% 

konfidensgrad.

x

(13)

Exempel: Färg

Medeltorktiden för en typ av färg är 12 minuter. En ny 

tillsats testas för att se om den förkortar torktiden. 16 ytor  målas och medelvärdet av torktiden oberveras till     = 11.1  och stickprovsvariansen till s2 = 0.36.

Bilda ett uppåt begränsat kondensintervall för den nya  medeltorktiden med kondensgrad 0.99 under antagande  om normalfördelning.

x

(14)

Exempel: Opinionsundersökning

I en politisk opinionsundersökning har man tillfrågat 2000  personer om partisympatier. 1087 svarar att de stöder 

regeringen, resten oppositionen. Har regeringen majoritet  bland väljarkåren? 

1. Undersök med ett dubbelsidigt konfidensintervall.

2. Undersök med ett nedåt begränsat konfidensintervall.

Konfidensgrad 0.95.

(15)

Exempel: Agent Orange

Riskabelt höga halter av dioxinet 2,3,7,8‐TCDD i blodet och 

fettvävnaden har observerats hos vietnamveteraner på grund av  exponering för avlövningsmedlet Agent Orange. I en studie har man  mätt mängden TCDD i blodplasma och fettvävnad hos tolv veteraner.

Veteran

TCDD‐nivå,  fettvävnad

TCDD‐nivå, plasma

1 4.9 2.5

2 5.9 3.1

3 4.4 2.1

4 6.9 3.5

5 7.0 3.1

6 4.2 1.8

Veteran

TCDD‐nivå,  fettvävnad

TCDD‐nivå, plasma

7 10.0 6.0

8 5.5 3.0

9 41.0 36.0

10 4.4 4.7

11 7.0 6.9

12 2.9 3.3

Kan vi från den här studien visa att det finns en systematisk skillnad  mellan nivåer av TCDD i fettvävnad och blodplasma? Konfidensgrad  98%. Lämpligt normalfördelningsantagande får göras.

(16)

Exempel: pH

I en experimentell process för vattenrening måste man  kontrollera att vattnet inte blir för surt eller basiskt (d.v.s. 

håller ett neutralt pH på 7). Processen genomförs tolv  gånger och pH‐värdet observeras varje gång.

8.25, 8.01, 6.41, 7.49, 8.29, 6.64, 8.11, 6.85, 8.05, 8.39,  9.06, 7.1

Antag att värdena är observationer från en  normalfördelning med parametrar μ och σ2.

1. Vad kan vi säga om det verkliga pH‐värdet i vattnet?

2. Kan vi med ett test kontrollera om processen  misslyckades med att hålla ett neutral pH på 7?

(17)

Exempel: Balanserat mynt

Vi vill undersöka om ett mynt är balanserat, d.v.s., att  sannolikheten att få krona är 0.5. Vi genomför därför 10  slantsinglingar och beslutar att myntet är obalanserat om  minst 9 av slantsinglingarna ger samma resultat.

1. Ställ upp nollhypotes och mothypotes. Vad har testet för  nivå?

2. Beräkna styrkefunktionen.

(18)

Exempel: Potatischips

En fabrikant av potatischips påstår att innehållet i en typ av  chipspåsar väger i genomsnitt minst 300 gram. För att 

kontrollera detta vägdes 16 påsar varvid man fick ett 

medelvärde på 295 gram. Anta att vikten kan anses vara  normalfördelad med en standardavvikelse på 15 gram.

1. Testa om fabrikantens påstående är korrekt. 

Signifikansnivån ska vara 5%.

2. Beräkna styrkan för en vikt på 290 gram.

(19)

Exempel: Värmeljus

En tillverkare av värmeljus påstår att brinntiden är 240 minuter. I ett  test genomfört av en välkänd konsumenttidning ifrågasattes 

påståendet och en statistisk undersökning genomfördes där 

brinntiden studerades. Ett stickprov av 15 värmeljus valdes ut och  brinntiden observerades. Stickprovsmedelvärdet beräknades till x 231. Brinntiden hos värmeljusen kan antas vara oberoende och  normalfördelade med känd varians  171.

a) Formulera lämpliga hypoteser och fördelningsantaganden. 

Genomför därefter ett enkelsidigt test för att testa om brinntiden  är kortare än 240 minuter. Signifikansnivån ska vara 5%.

b) Beräkna p‐värdet för testet i (a).

c) Vad har testet i (a) för styrka om den sanna brinntiden är 235  minuter?

(20)

Exempel: Nytt läkemedel mot högt blodtryck

Vid ett kliniskt försök undersöks effekten av ett nytt   blodtryckssänkande läkemedel. I studien deltar n = 17 

individer och deras blodtryck mäts (i mmHg) före (x1, . . . ,  x17) samt 12 timmar efter (y1, . . . , y17) medicinering . 

Före (x)

153.8, 171.3, 161.6, 160.6, 140.8, 169.0, 189.3, 184.9 176.4, 144.6, 147.6, 162.0,  160.9, 180.0, 182.6, 169.0, 171.6 

Efter (y)

143.4, 173.4, 152.2, 138.6, 158.1, 149.0, 163.1, 145.5, 161.9, 152.8, 148.9, 171.7,  165.4, 171.3, 165.5, 151.0, 140.6

1. Använd ett teckentest för att testa om läkemedlet  sänker blodtrycket. Signifikansnivån får max vara 5%.

(21)

Wilcoxons teckenrangtest

x y

0.79 1.73 1.83 1.65 1.14 2.19 1.27 1.39 1.86 1.41 1.72 1.48 2.09 1.22 1.90 1.41 d ‐1.07 0.32 0.12 0.17 ‐0.95 0.97 ‐0.63 ‐0.02 Stickprov

Beräkna rangen

|d| 1.07 0.32 0.12 0.17 0.95 0.97 0.63 0.02 0.02 0.12 0.17 0.32 0.63 0.95 0.97 1.07

8 4 2 3 6 7 5 1

(22)

Wilcoxons teckenrangtest

x y

0.79 1.73 1.83 1.65 1.14 2.19 1.27 1.39 1.86 1.41 1.72 1.48 2.09 1.22 1.90 1.41 d ‐1.07 0.32 0.12 0.17 ‐0.95 0.97 ‐0.63 ‐0.02 Stickprov

Beräkna rangen

|d| 1.07 0.32 0.12 0.17 0.95 0.97 0.63 0.02

8 4 2 3 6 7 5 1

s+=4+2+3+7=16

(23)

Exempel: Nytt läkemedel mot högt blodtryck

Vid ett kliniskt försök undersöks effekten av ett nytt   blodtryckssänkande läkemedel. I studien deltar n = 17 

individer och deras blodtryck mäts (i mmHg) före (x1, . . . ,  x17) samt 12 timmar efter (y1, . . . , y17) medicinering . 

Före (x)

153.8, 171.3, 161.6, 160.6, 140.8, 169.0, 189.3, 184.9 176.4, 144.6, 147.6, 162.0,  160.9, 180.0, 182.6, 169.0, 171.6 

Efter (y)

143.4, 173.4, 152.2, 138.6, 158.1, 149.0, 163.1, 145.5, 161.9, 152.8, 148.9, 171.7,  165.4, 171.3, 165.5, 151.0, 140.6

1. Använd ett teckentest för att testa om läkemedlet  sänker blodtrycket. Signifikansnivån får max vara 5%.

2. Använd istället Wilcoxons rangteckentest för att testa  om läkemedlet sänker blodtrycket. Signifikansnivån ska  vara den samma, dvs max 5%.

(24)

Wilcoxons rangsummetest

x

y

2.42 4.87 4.07 6.29 ‐0.54 0.48 1.74 2.22

3.39 1.04 8.42 3.49 5.51 6.20 Stickprov 1

Sammanslaget stickprov

2.42  4.87  4.07  6.29  ‐0.54  0.48  1.74  2.22 3.39 1.04  8.42  3.49  5.51  6.20

6      10      9       13         1       2        4       5        7       3      14      8       11      12 wX=6+10+9+13+1+2+4+5=50

Stickprov 2

c

x y

wY=7+3+14+8+11+12=55

(25)

Exempel: Genuttryck i cancer

Mängden mRNA av genen p53 misstänks vara 

sammankopplad med aggressiviteten hos en viss typ av  tumörer. För att undersöka om så är fallet uppmättes  mRNA‐nivån hos p53 hos 10 patienter med

den snälla formen (x1, . . . , x10) och hos 9 patienter med den  aggressivare formen (y1, . . . , y9) av tumören. 

Wilcoxons rangsumma för det första stickprovet beräknades  till wx=138.

5.78  5.28  7.73  7.88  5.20  8.23  4.38  5.77  4.54  3.12 Stickprov 1 (m=10)

Stickprov 2 (n=9)

‐1.49  5.22 ‐5.20  0.21 ‐0.62  5.06  2.14  3.00  0.32

(26)

1. Använd Wilcoxons rangsummetest för att testa om det  finns ett högre uttryck av p53 hos patienter med den 

snällare cancerformen. Signifikansnivån får max vara 5%.

2. Beräkna p‐värdet för testet i 1.

(27)

Exempel: Töjning av tyg

Ett mellanlager av foder används mer och mer för att stödja yttre  materiallager och för att förbättra form och fall hos olika klädtyper. 

Följande data på töjning uppmättes för tyg från hög (H) och låg (L)  kvalité.

H: 1.2 0.9 0.7 1.0 1.7 1.7 1.1 0.9 1.7 1.9 1.3 2.1 1.6 1.8 1.4 1.3 1.9 1.6 0.8 2.0 1.7 1.6 2.3 2.0

L: 1.6 1.2 1.1 2.1 1.5 1.3 1.0 2.6

Vi vill veta om det råder någon skillnad i töjbarhet mellan de båda  kvaliteterna. Gör ett test på nivå 0.05. Normalfördelning för antas.

1. Standardavvikelserna för de två stickproven är σH=0.4 och σL=0.5.

2. Standardavvikelserna är olika och okända.

3. Standardavvikelserna antas vara lika men okända.

(28)

Exempel: EEG

EEG används för att mäta elektrisk aktivitet i hjärnan. Ett försök 

utfördes på 20 kanadensiska fångar för att undersöka om isolering har  en effekt på hjärnaktiviteten. De 20 fångarna delades slumpmässigt i  två lika stora grupper där individer från den ena gruppen isolerades  medan individerna i den andra grupper fick vara kvar i sina egna  celler. Försöket varade i sju dagar.

Ej isolerade (xi) Isolerade (yi)

10.7 9.6

10.7 10.4

10.4 9.7

10.9 10.3

10.5 9.2

10.3 9.3

9.6 9.9

11.1 9.5

11.2 9.0

10.4 10.9

(frekvens av alpha‐vågor) Ej isolerade Isolerade

(29)

Exempel: Durra

Durra är en viktig gröda var kvalitet och utseende påverkas av 

pigment i fruktämnet. Korsning mellan två arter av durra har gjorts för  att producera plantor med röda frön. Plantorna med röda frön har 

sedan självkorsats. Teoretiskt sett ska röda, gula och vita frön 

förekomma i förhållandena 9:3:4. Följande data registrerades hos 368  självkorsade plantor:

Fröfärg Röd Gul Vit

Observerad 

frekvens 195 73 100

Kan vi bekräfta den teoretiska fördelningen (Mendelsk  nedärvning) eller stämmer inte vår teori? Signifikansnivå  0.05.

(30)

Exempel: Elektronrör

För att bestämma livslängden hos elektronrör används en 

exponetialfördelning med väntevärde μ=1/λ. Livslängden (y) för 50  elektronrör observerades:

Kategori

Observerad frekvens

0≤y<20 14

20≤y<40 18

40≤y<60 7

60≤y<80 6

80≤y 5

1. Antag att μ=25. Testa med hjälp av ett χ2‐test om  modellantagandet stämmer.

2. Uppskatta μ från datan och testa med hjälp av ett χ2‐test om  modellantagandet stämmer.

(31)

Exempel: Kalcium och blodtryck

Man misstänker att mängden kalcium i blodplättar kan vara kopplat  till blodtrycket. I en studie valdes 38 personer med normal blodtryck  ut. För varje person mättes kalciumnivå (yi) och blodtryck (xi). Finns  det ett linjärt samband?

Individ Kalcium (yi)

Blodtryck (xi)

1 95 84

2 112 109

3 122 96

4 88 98

5 87 92

6 104 87

7 90 86

8 110 93

9 100 103

10 122 95

11 126 101

12 102 90

13 122 100

Individ Kalcium (yi)

Blodtryck (xi)

14 96 87

15 135 109

16 130 97

17 127 100

18 125 112

19 103 84

20 112 93

21 120 100

22 107 91

23 107 92

24 112 93

25 93 87

26 80 105

Individ Kalcium (yi)

Blodtryck (xi)

27 88 87

28 86 78

29 107 90

30 78 87

31 88 82

32 121 97

33 125 99

34 130 94

35 107 95

36 115 100

37 110 90

38 126 108

(32)

“Life is good for only two things: 

doing mathematics and teaching it.”

Siméon Denis Poisson

1781‐1840

Figur

Updating...

Referenser

Updating...

Relaterade ämnen :