• No results found

Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioin- formatik, 7,5p.

N/A
N/A
Protected

Academic year: 2021

Share "Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioin- formatik, 7,5p."

Copied!
4
0
0

Loading.... (view fulltext now)

Full text

(1)

Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioin- formatik, 7,5p.

Tid: Onsdagen den 22 augusti, 2012 kl 08.00 - 12.00.

Examinator: Erik Kristiansson

Jour: Viktor Jonsson, tel 031-772 3556

Hj¨ alpmedel: kalkylator, egen handskriven formelsamling (fyra A4 sidor) samt med skrivningen utdelade tabellsidor.

Max ¨ ar 32 po¨ ang. F¨ or godk¨ ant kr¨ avs minst 15 po¨ ang, f¨ or betyget 4 kr¨ avs 21 po¨ ang och f¨ or 5 kr¨ avs 26 po¨ ang. Uppgifterna kommer inte i sv˚ arighetsordning.

1. I en urna finns tv˚ a svarta och tre r¨ oda bollar.

(a) Antag att tv˚ a bollar dras p˚ a m˚ af˚ a utan ˚ aterl¨ aggning. L˚ at X vara det total antalet r¨ oda bollar efter de tv˚ a dragningarna. Ber¨ akna sannolikhetsf¨ ordelningen p

X

(x) samt v¨ antev¨ ardet f¨ or X.

(b) Antag att tv˚ a bollar dras p˚ a m˚ af˚ a och att ˚ aterl¨ aggning endas sker d˚ a svarta bollar dras. L˚ at Y vara det totala antalet r¨ oda bol- lar efter de tv˚ a dragningarna. Ber¨ akna sannolikhetsf¨ ordelningen p

Y

(y) samt v¨ antev¨ ardet f¨ or Y .

(4 p)

2. I en klinisk studie blir ˚ atta patienter med h¨ ogt blodtryck behand- lade med ett nytt l¨ akemedel. M˚ alet med studien ¨ ar att unders¨ oka om l¨ akemedlet har en positiv eller negativ effekt, dvs att patienter efter be- handling f˚ ar ett f¨ or¨ andrat blodtryck. Blodtrycket f¨ or de tio patienterna uppm¨ ats f¨ ore (x

1

, . . . , x

8

) och efter (y

1

, . . . , y

8

) behandlingen. Dessu- tom ber¨ aknades skillnaden i blodtryck efter behandlingen (d

1

, . . . , d

8

d¨ ar d

i

= y

i

− x

i

). Resultatet blev

F¨ ore Efter Skillnad

146 153 6

147 141 -6

143 145 2

149 138 -11

164 151 -13

140 128 -12

151 136 -16

141 129 -11

1

(2)

Medelv¨ arden och standardavvikelser ber¨ aknades till ¯ x = 147.6, ¯ y = 140.1, ¯ d = −8.2 respektive s

x

= 7.63, s

y

= 9.26, s

d

= 6.99. Observa- tionerna kan antas vara oberoende och normalf¨ ordelade. Variansen f¨ ore och efter behandling kan antas vara lika.

(a) J¨ amf¨ or skillnaden i blodtryck f¨ ore och efter behandling genom ett tv˚ a-stickprovs t-test. Formulera l¨ ampliga hypoteser och genomf¨ or testet. Signifikansniv˚ an ska vara 0.05.

(b) J¨ amf¨ or skillnaden i blodtryck f¨ ore och efter behandling genom ett parat t-test. Formulera l¨ ampliga hypoteser och genomf¨ or testet.

Signifikansniv˚ an ska vara 0.05.

(c) Diskutera vilket utav testen som ¨ ar mest l¨ ampligt.

(5 p)

3. Antag att X ¨ ar en likformigt f¨ ordelad stokastisk variabel med t¨ athetsfunktion f

X

(x) = 1

2 , −1 ≤ x ≤ 1.

L˚ at Y = X

2

och ber¨ akna kovariansen mellan X och Y . Diskutera re- sultatet. (4 p)

4. I en maskin f¨ or sekvensering av DNA uppst˚ ar oberoende avl¨ asningsfel med felsannolikheten p.

(a) Antag att p = 0.02 och att ett 100 nukleotider l˚ angt DNA-fragment ska sekvenseras. L˚ at X vara det totala antalet fel. Best¨ am f¨ ordelningen f¨ or X och ber¨ akna d¨ arefter v¨ antev¨ arde och standardavvikelse.

(b) Vid sekvensering av ett 5000 nukleotider l˚ angt DNA-fragment identifierades 79 fel. Uppskatta felsannolikheten p med hj¨ alp av momentmetoden. Ber¨ akna d¨ arefter ett approximativt dubbel- sidigt konfidensintervall med konfidensgrad 99%. Kan vi utesluta att p = 0.02?

(5 p)

5. L˚ at X vara exponentialf¨ ordelad stokastisk variabel med t¨ athetsfunktion f

X

(x) = λe

−λx

, x ≥ 0.

v¨ antev¨ arde paramter 1/λ.

2

(3)

(a) Ber¨ akna v¨ antev¨ ardet och medianen f¨ or X. Vilket v¨ arde ¨ ar st¨ orst?

Diskutera.

(b) Visa att P(X > x + y|X > x) = P(X > y).

(5 p)

6. Felet (x) vid m¨ atning av DNA-koncentration misst¨ anks vara normalf¨ ordelat.

F¨ or att fastst¨ alla om s˚ a ¨ ar fallet genomf¨ ordes 100 kontrollm¨ atningar d¨ ar felet observerades.

Fel-intervall Antal m¨ atningar

x ≤ −1 23

−1 < x ≤ 0 26 0 < x ≤ 1 28 1 < x 23

Genomf¨ or χ

2

-test f¨ or att unders¨ okan om felet kommer fr˚ an en nor- malf¨ ordelning med v¨ antev¨ arde µ = 0 och standardavvikelse σ = 1.

Anv¨ and en signifiansniv˚ a p˚ a 0.05.

(5 p)

7. Using a gap score of -2 and match/mismatch scores taken from the PAM250 substitution matrix (given below), derive the score matrix for a local alignment of ”GYTDN” with ”FSER”.

In this case, what is the score of an optimal local alignment? Give the alignment(s) with this score.

PAM250 substitution matrix:

3

(4)

A R N D C Q E G H I L K M F P S T W Y V A 2

R -2 6

N 0 0 2

D 0 -1 2 4 C -2 -4 -4 -5 4 Q 0 1 1 2 -5 4 E 0 -1 1 3 -5 2 4 G 1 -3 0 1 -3 -1 0 5 H -1 2 2 1 -3 3 1 -2 6 I -1 -2 -2 -2 -2 -2 -2 -3 -2 5 L -2 -3 -3 -4 -6 -2 -3 -4 -2 2 6 K -1 3 1 0 -5 1 0 -2 0 -2 -3 5 M -1 0 -2 -3 -5 -1 -2 -3 -2 2 4 0 6 F -4 -4 -4 -6 -4 -5 -5 -5 -2 1 2 -5 0 9 P 1 0 -1 -1 -3 0 -1 -1 0 -2 -3 -1 -2 -5 6 S 1 0 1 0 0 -1 0 1 -1 -1 -3 0 -2 -3 1 3 T 1 -1 0 0 -2 -1 0 0 -1 0 -2 0 -1 -2 0 1 3 W -6 2 -4 -7 -8 -5 -7 -7 -3 -5 -2 -3 -4 0 -6 -2 -5 17 Y -3 -4 -2 -4 0 -4 -4 -5 0 -1 -1 -4 -2 7 -5 -3 -3 0 10 V 0 -2 -2 -2 -2 -2 -2 -1 -2 4 2 -2 2 -1 -1 -1 0 -6 -2 4 (4 p)

4

References

Related documents

This study assessed whether level of physical activity (PA) and a musculoskeletal composite score could be used as fracture predictive tools, and if the score could predict

(a) Assuming a match score of 2, a mismatch score of -1 and a gap score of -2, derive the score matrix for a local alignment of &#34;GAAC&#34;..

16 ytor m˚ alas och medelv¨ ardet av torktiden oberveras till ¯ x = 11.1 och stickprovsvariansen till s 2 = 0.36.. a Bilda ett upp˚ at begr¨ ansat konfidensintervall f¨ or den

F¨ or godk¨ ant kr¨ avs minst 15 po¨ ang totalt och minst 4 po¨ ang p˚ a sannolikhetsteori- och statistik-delen vardera samt minst 3 po¨ ang p˚ a bioinfor-

(2p) b Vad ¨ar den betingade sannolikheten vid kast av 3 vanliga t¨arningar f¨or h¨andelsen B=” minst en t¨arning visar po¨angen 3” givet h¨andelsen A=”.. summan av kasten ¨

För godkänt krävs minst 15 poäng totalt och minst 4 poäng på sannolikhetsteori- och statistikdelen vardera samt minst 3 poäng på bioin-

Tiden det tar f¨ or att avsluta ett ¨ arende antas vara exponentialf¨ ordelad d¨ ar v¨ antev¨ ardet beror p˚ a typen av ¨ arende... M¨ angden mRNA av genen PROM1 misst¨ anks

Antag att observationerna fr˚ an m¨ atningen ¨ ar oberoende och slumpm¨ assigt dragna fr˚ an en normalf¨ ordelning med ok¨ ant v¨ antev¨ arde µ och k¨ and varians σ 2 = 4..