• No results found

Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioin- formatik, 7,5 hp.

N/A
N/A
Protected

Academic year: 2021

Share "Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioin- formatik, 7,5 hp."

Copied!
4
0
0

Loading.... (view fulltext now)

Full text

(1)

Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioin- formatik, 7,5 hp.

Tid: Tisdag den 16 december, 2008 kl 8.30 - 12.30 Eklandagatan 86.

Examinator: Olle Nerman, tel 7723565.

Jour: Frank Eriksson, tel 073-7263051.

Hj¨ alpmedel: Egen handskriven formelsamling (fyra A4-sidor) samt med skrivningen utdelade tabellsidor.

Maxpo¨ ang: 32. F¨ or godk¨ ant kr¨ avs minst 15 po¨ ang totalt och minst 4 po¨ ang p˚ a sannolikhetsteori- och statistik-delen vardera samt minst 3 po¨ ang p˚ a bioin- formatikdelen. F¨ or betyget 4 kr¨ avs 20 po¨ ang och f¨ or betyget 5 25 po¨ ang.

Sannolikhetsteori

1. I en skolklass om 30 elever ¨ ar 18 flickor och 12 pojkar. En grupp av tre elever v¨ aljs ut f¨ or att representera klassen i skolans elevr˚ ad, s˚ a att varje grupp om tre elever har samma sannolikhet att bli vald.

Hur stor ¨ ar sannolikheten att minst en flicka kommer att finnas bland representanterna? (3p)

2. Tjockleken av en p˚ a m˚ af˚ a vald pocketbok i ordinarie (enorma) sorti- mentet i en stor bokhandel har v¨ antev¨ ardet µ =1,5 cm och standar- davvikelsen σ =0,5 cm. Om du k¨ oper 50 slumpm¨ assigt valda pock- etb¨ ocker fr˚ an bokhandeln vad ¨ ar d˚ a den ungef¨ arliga sannolikheten att de f˚ ar plats (i en rad) i din bokhylla med ”innerbredd” 80 cm? (3 p) 3. Kasta tv˚ a t¨ arningar.

a ¨ Ar h¨ andelserna A={summan av t¨ arningarna=12} och B={skillnaden p˚ a t¨ arningspo¨ angen=0} oberoende? (2p)

b ¨ Ar h¨ andelserna C={summan av t¨ arningarna=7} och D={f¨ orsta t¨ arningen visar en trea} oberoende? (1p)

c Ber¨ akna de betingade sannolikheterna P (A|B) respektive P (C|D).

(1p)

4. a Varf¨ or kan man s¨ aga att en ”s¨ aker” h¨ andelse A, som har sanno- likheten P (A) = 1 ¨ ar oberoende av sig sj¨ alv? (1p)

b Finns det n˚ agra andra x f¨ or vilket P (A) = x medf¨ or samma kon- stiga slutsats? I s˚ a fall vilka x? (1p)

1

(2)

Statistik

4. En paretof¨ ordelning har t¨ athetsfunktion f (x) = θ

x

θ+1

, x ≥ 1 d¨ ar vi vet att θ >1. Du har tillg˚ ang till

a Vilket ¨ ar v¨ antev¨ ardet i en s˚ adan paretof¨ ordelning? (1p)

T¨ ank dig nu ett stickprov fr˚ an en s˚ adan paretof¨ ordelning, x

1

, . . . , x

n

, med oberoende variabler.

b Hur ser momentskattaren av θ ut? (2p)

c Hur ser maximum likelihoodskattaren av θ ut? (2p)

5. Medeltorktiden f¨ or en typ av f¨ arg ¨ ar 12 minuter. En ny tillsats testas f¨ or att se om den f¨ orkortar torktiden. 16 ytor m˚ alas och medelv¨ ardet av torktiden oberveras till ¯ x = 11.1 och stickprovsvariansen till s

2

= 0.36.

a Bilda ett upp˚ at begr¨ ansat konfidensintervall f¨ or den nya medel- torktiden med konfidensgrad 0.95 under antagande om normalf¨ ordelning.

(2p)

b Tolka om intervallet till ett test av

H

0

:medeltorktiden f¨ or den nya f¨ argen≥ 12

Vad blir din slutsats och vilken signifikansniv˚ a har testet? (2p) 6. En gen f¨ orekommer som allelerna A och a. F¨ or att unders¨ oka om

populationen befinner sig i Hardy-Weinbergj¨ amvikt, det vill s¨ aga om genotyperna AA, Aa och aa f¨ orekommer i proportionerna θ

2

, 2θ(1 − θ) respektive (1 − θ)

2

, har 80 individer p˚ a m˚ af˚ a valts f¨ or genotypning med f¨ oljande resultat.

Typ AA Aa aa Antal 12 36 32

Det ¨ ar k¨ ant att andelen A-gener i populationen ¨ ar 1/4. ¨ Ar den givna modellen rimlig? (3p)

2

(3)

Bioinformatik

7. Sekvensbioinformatik

(a) Assuming a match score of 2, a mismatch score of -1 and a gap score of -2, derive the score matrix for a global alignment of

”ATTA” and ”ATTTTA”.

In this case, what is the score of an optimal global alignment? How many alignments have this optimal score (remember: each path represents a different alignment)? What are these alignments?

(2p)

(b) How are z-scores used in assessing the significance of global align- ment scores? Explain how a z-score is calculated. (2p)

3

(4)

8. Strukturbioinformatik.

(a) An HSSP-curve is sketched below.

i Explain what the horizontal and vertical axes represent.

ii Points are plotted on an HSSP curve using two different sym- bols (e.g. a cross and a small square). Explain what these points represent.

iii Explain the significance of the region above the curve. (3p)

(b) Describe a pattern in a multiple sequence alignment that would suggest the presence of an alpha-helix.

Explain why that pattern suggests an alpha-helix.

(2p)

4

References

Related documents

När doktoranden anländer till hållplat- sen, låt X vara tiden tills en spårvagn från linje 6 kommer och Y vara tiden tills en spårvagn från linje 8 kommer.. Antag också att X och

Grupp 1 fick sedan se en bild p˚ a en v¨ alkl¨ add person med trevligt utseende som p˚ astods vara den ˚ atalade.. Grupp 2 fick ist¨ allet se en bild p˚ a en illa kl¨ add person

F¨ or godk¨ ant kr¨ avs minst 15 po¨ ang totalt och minst 4 po¨ ang p˚ a sannolikhetsteori- och statistik-delen vardera samt minst 3 po¨ ang p˚ a bioinfor-

(2p) b Vad ¨ar den betingade sannolikheten vid kast av 3 vanliga t¨arningar f¨or h¨andelsen B=” minst en t¨arning visar po¨angen 3” givet h¨andelsen A=”.. summan av kasten ¨

För godkänt krävs minst 15 poäng totalt och minst 4 poäng på sannolikhetsteori- och statistikdelen vardera samt minst 3 poäng på bioin-

Tiden det tar f¨ or att avsluta ett ¨ arende antas vara exponentialf¨ ordelad d¨ ar v¨ antev¨ ardet beror p˚ a typen av ¨ arende... M¨ angden mRNA av genen PROM1 misst¨ anks

Using a gap score of -2 and match/mismatch scores taken from the PAM250 substitution matrix (given below), derive the score matrix for a local alignment of ”GYTDN” with ”FSER”..

Antag att observationerna fr˚ an m¨ atningen ¨ ar oberoende och slumpm¨ assigt dragna fr˚ an en normalf¨ ordelning med ok¨ ant v¨ antev¨ arde µ och k¨ and varians σ 2 = 4..