• No results found

Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioin- formatik, 7,5p.

N/A
N/A
Protected

Academic year: 2021

Share "Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioin- formatik, 7,5p."

Copied!
3
0
0

Loading.... (view fulltext now)

Full text

(1)

Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioin- formatik, 7,5p.

Tid: Onsdagen den 3 april 2013, kl 08.30 - 12.30.

Examinator: Erik Kristiansson

Jour: Erik Kristiansson, tel 070-5259751

Hj¨ alpmedel: kalkylator, egen handskriven formelsamling (fyra A4 sidor) samt med skrivningen utdelade tabellsidor.

Max ¨ ar 32 po¨ ang. F¨ or godk¨ ant kr¨ avs minst 15 po¨ ang, f¨ or betyget 4 kr¨ avs 20 po¨ ang och f¨ or 5 kr¨ avs 25 po¨ ang. Uppgifterna kommer inte i sv˚ arighetsordning.

1. M˚ anadsl¨ onen f¨ ore skatt hos en heltidsarbetande slumpm¨ assigt utvald svensk medborgare kan beskriva med hj¨ alp av en Paretof¨ ordelad stokastisk variabel X som har t¨ athetsfunktionen

f (x) = αβ

α

x

α+1

, x ≥ β.

Antag att α = 2 och β = 15000.

(a) Ber¨ akna sannolikheten att l¨ onen f¨ ore skatt hos en heltidsarbe- tande slumpm¨ assigt utvald svensk medborgare ¨ ar mellan 30000 och 60000? Vad ¨ ar sannolikheten att den ¨ overstiger 60000?

(b) Visa att den f¨ orv¨ antade l¨ onen E[X] ¨ ar st¨ orre ¨ an medianl¨ onen m

X

. (5 p)

2. Koncentrationen av DNA i ett prov m¨ ats med hj¨ alp av en spektro- fotometer. Eftersom m¨ atningen ¨ ar os¨ aker upprepas den 10 g˚ anger (x

1

, . . . , x

10

) d¨ ar medelv¨ ardet ber¨ aknas till ¯ x = 4.87 (µg/mL). Antag att observationerna fr˚ an m¨ atningen ¨ ar oberoende och slumpm¨ assigt dragna fr˚ an en normalf¨ ordelning med ok¨ ant v¨ antev¨ arde µ och k¨ and varians σ

2

= 4.

(a) Ber¨ akna ett dubbelsidigt konfidensintervall f¨ or v¨ antev¨ ardet av m¨ angden DNA (µ). Konfidensgraden ska vara 99%.

(b) Om du ¨ andrar stickprovsstorleken fr˚ an 10, hur m˚ anga m¨ atningar m˚ aste g¨ oras om l¨ angden p˚ a konfidensintervallet inte ska ¨ overstiga 1 (µg/mL)?

1

(2)

(4 p)

3. L˚ at X beteckna antalet po¨ ang en slumpm¨ assig bioteknikstudent f˚ ar p˚ a den inledande uppgiften i en tentamen i kursen TMS145. Antag att X har f¨ oljande sannolikhetsf¨ ordelning

p

X

(x) =

 

 

 

 

0.15 x = 0 0.05 x = 1 0.20 x = 2 0.35 x = 3 0.25 x = 4.

Antag vidare att po¨ angen fr˚ an olika studenter ¨ ar oberoende och likaf¨ ordelade.

L˚ at ¯ X vara medelpo¨ angen av 52 tenterande bioteknikstudenter.

(a) Ber¨ akna v¨ antev¨ ardet och variansen f¨ or X.

(b) Anv¨ and centrala gr¨ ansv¨ ardessatsen f¨ or att ber¨ akna en approxima- tiv f¨ ordelning f¨ or ¯ X. Gl¨ om inte att motivera approximationen.

(c) Ber¨ akna den approximativa sannolikheten att medelpo¨ angen p˚ a uppgiften bland de 52 tenterande ¨ ar st¨ orre ¨ an 3.

(5 p)

4. Efter ett milj¨ outsl¨ app av stora m¨ angder antibiotika unders¨ oks f¨ orekomsten av motst˚ andskraftiga bakterier. D¨ arf¨ or samlades tv˚ a stickprov in, ett med 35 jordprov fr˚ an den f¨ ororenade milj¨ on (x

1

, . . . , x

35

) och ett med 43 jordprov fr˚ an en kontrollmilj¨ o (y

1

, . . . , y

43

). M¨ angden motst˚ andskraftiga bakterier uppm¨ attes sedan med hj¨ alp av PCR och f¨ oljande medelv¨ arden och standardavvikelser ber¨ aknades ¯ x = 0.110, s

x

= 0.109, ¯ y = 0.0479 och s

y

= 0.011 (m¨ atv¨ ardena beskriver relativ m¨ angd motst˚ andskraftiga bakterier). Av tidigare erfarenhet vet man att variationen i de olika stickproven ej kan antas vara lika.

(a) Formulera l¨ ampliga hypoteser och f¨ ordelningsantaganden. Genomf¨ or sedan ett enkelsidigt test f¨ or att unders¨ oka om m¨ angden motst˚ andskraftiga bakterier ¨ ar h¨ ogre i den f¨ ororenade milj¨ on. Signifikansniv˚ an ska

vara 0.01.

(b) Ber¨ akna p-v¨ ardet f¨ or testet i (a).

(5 p)

2

(3)

5. L˚ at X vara en stokastisk variabel med t¨ athetsfunktionen f

X

(x) = (a + 1)x

a

, 0 < x < 1,

d¨ ar a ¨ ar en ok¨ and positiv parameter.

(a) Anv¨ and momentmetoden f¨ or att h¨ arleda en punktskattning ˆ a

M

av a.

(b) Anv¨ and maxmimum-likelihoodmetoden f¨ or att h¨ arleda en punkt- skattning ˆ a

M L

av a.

(c) Antag att X

1

, . . . , X

5

antar v¨ ardena 0.87, 0.93, 0.50, 0.66, 0.80. Ber¨ akna observations-v¨ arden p˚ a ˆ a

M

och ˆ a

M L

. ¨ Ar punktskattningarna lika?

F¨ orklara.

(5 p)

6. L˚ at X och Y vara tv˚ a kontinuerliga och oberoende stokastiska vari- abeler som b˚ ada ¨ ar likformigt f¨ ordelade mellan 0 och 1.

(a) Ber¨ akna P(X + Y ≤ 0.5).

(b) L˚ at Z = −ln(X). Visa att Z ¨ ar exponentialf¨ ordelad med param- eter λ = 1.

(4 p)

7. (a) What is the Levenshtein distance between strings ”ATA” and

”TAA”? Explain your answer.

(b) Assuming a match score of 2, a mismatch score of -1 and a gap score of -2, derive the score matrix for a global alignment of ”ATA”

and ”TAA”.

In this case, what is the score of an optimal global alignment? How many alignments have this optimal score (remember: each path represents a different alignment)? What are these alignments?

(4 p)

3

References

Related documents

(a) Utg˚aende fr˚an att de ovan beskrivna h¨andelserna ¨ar oberoende av var- andra, hur stor ¨ar sannolikheten att en slumpm¨assigt utvald student inte har f˚att

Nedan nns plottar på data (a), (b) och (c) där man anpassat en regressionsmodell samt plottar på residualerna från varje regressionsmodell.. Vilken skatterplot hör till

När doktoranden anländer till hållplat- sen, låt X vara tiden tills en spårvagn från linje 6 kommer och Y vara tiden tills en spårvagn från linje 8 kommer.. Antag också att X och

Grupp 1 fick sedan se en bild p˚ a en v¨ alkl¨ add person med trevligt utseende som p˚ astods vara den ˚ atalade.. Grupp 2 fick ist¨ allet se en bild p˚ a en illa kl¨ add person

16 ytor m˚ alas och medelv¨ ardet av torktiden oberveras till ¯ x = 11.1 och stickprovsvariansen till s 2 = 0.36.. a Bilda ett upp˚ at begr¨ ansat konfidensintervall f¨ or den

F¨ or godk¨ ant kr¨ avs minst 15 po¨ ang totalt och minst 4 po¨ ang p˚ a sannolikhetsteori- och statistik-delen vardera samt minst 3 po¨ ang p˚ a bioinfor-

(2p) b Vad ¨ar den betingade sannolikheten vid kast av 3 vanliga t¨arningar f¨or h¨andelsen B=” minst en t¨arning visar po¨angen 3” givet h¨andelsen A=”.. summan av kasten ¨

För godkänt krävs minst 15 poäng totalt och minst 4 poäng på sannolikhetsteori- och statistikdelen vardera samt minst 3 poäng på bioin-