• No results found

3 Introduktion till genetik

6.1 Ett exempel

±

LOD-värdet för givet lokus är c2-fördelade med en frihetsgrad. För att bestämma signifikans har vi använt följande gränser:

Nominell koppling ( p<0.05) LOD>=0.5875 Suggestive koppling (p<0.00074) LOD>=2.2 Signifikant koppling (p<0.000022) LOD>=3.6

p-värdena ovan har valts enligt Lander E och Kruglyak L, 1995, där hänsyn har tagits till att många test på genomet utförs simultant. En motivering för hur LOD-värdena erhållits följer nedan.

Eftersom testet endast är signifikant då 0 < q < 0,5 har det endast en svans, så under nollhypotesen gäller att 2ln10*LOD är c2

( )

1 -fördelad med sannolikheten ½ och 0 med sannolikheten ½ (Nyholt D.R., 2000). LOD-värdet för respektive p-värde beräknas med

(

LOD

) ( )

LOD-värdet kan sedan beräknas:

2

Det är viktigt att kontrollera tecknet på d. Om den är negativ betyder det att det är mindre alleldelning än förväntat, men det kan ge höga värden på LOD utan att det tyder på koppling.

6.1 Ett exempel

För att göra beräkningarna enkla använder vi endast en familj. I familjen finns det fyra syskon och tre av syskonen är sjuka (har diabetes). Barnens genuppsättning ser för en viss markör ut på följande sätt (Barnen markerade med grått är sjuka):

1, 2 1, 3 1, 3 1, 2

? ?

Figur 13: Ett exempel där vi endast vet vilka alleler barnen har. Tre av de fyra syskonen har diabetes. Barnen markerade med grått är sjuka.

Allelfrekvenserna i hela populationen för allel 1, allel 2 resp allel 3 antas vara p1 = 0,1, p2 = 0,2 och p3 = 0,3 och 0,4 för övriga alleler.

För att barnen ska kunna se ut på det här sättet kan vi anta att föräldrarna har följande alleler vid markören:

1, 2 1, 3 1, 3 1, 2

1, x 2, 3

1 x 2 3

Figur 14: För att barnen ska kunna ha de alleler de har kan vi anta att föräldrarna och mor- och farföräldrarna ser ut som i figuren. x symboliserar att mormor kan ha vilken allel som helst.

De olika genptyperna för barnen är 1-2 och 1-3, detta medför att ena föräldern måste ha en etta och den andra måste ha allel 2 och 3. Vi kan då, utan inskränkning, anta att 1:an kommer från farfar och 2:an från morfar och 3:an från mormor (se Figur 14). Farmor kan då ha en godtycklig allel vi lokuset. Detta ger att det finns två sätt på vilket föräldrarna kan se ut.

Antingen har farmor en 1-allel eller så har hon inte 1-allelen (d.v.s. vilken som helst av de andra allelerna).

Eftersom det är tre av syskonen som är sjuka i familjen kommer arvsvektorn att innehålla sex element. De två första siffrorna avser första barnet, där första siffran är 1 om allelen kommer från farfar och 0 om den kommer från farmor, andra siffran talar om varifrån den andra allel kommer, från morfar eller mormor. Nästa två siffror talar om vilka alleler som det andra barnet har ärvt. Och de två sista siffrorna avser det sista barnet. Om farmor har 1-allelen finns det åtta möjliga arvsvektorer.

( )

kan då beräknas med populationsallelfrekvenserna. För det här alternativet är

( )

gv =Õp =ai p12p2p3

p .

Och om farmor har en annan allel än allel 1 finns endast 1 möjlig v-vektor:

(

11,10,11

)

9 = v

Och det ger p

( )

gv =Õpai =p1

(

1-p1

)

p2p3

Genom att titta på arvsvektorerna vi kan Spair

( )

vi bestämmas. Om vi t.ex. tittar på arvsvektorn ser vi att syskon 1 och syskon 2 delar 1 allel IBD. Detta kan utläsas av att båda syskonen har en 1:a på första platsen som betyder att båda har ärvt den allelen från farfar, syskon 1 har sedan en 1:a för den andra allelen och syskon 2 har en 0:a, det betyder att de inte delar den allelen IBD. På samma sätt kan man avläsa att syskon 1 och syskon 3 delar 2 alleler IBD och att syskon 2 och syskon 3 delar 1 allel IBD. Vilket ger att

v1

( )

v1 =4

Spair . Vi kan sedan utföra liknande beräkningar för samtliga v och får då att:

( ) ( )

Sedan beräknar vi väntevärde och varians för Spair:

2

Fortsättningsvis beräknar vi d genom att maximera ˆ p

( )

gd =

å

v p

( ) ( )

gv p vd .

c eftersom det finns tre sjuka syskon i familjen. Detta ger att:

( )

gd

3+ . Vi sätter sedan in allelfrekvenserna i uttrycket och får då d . Vilket ger att p

(

gd

)

maximeras av stora d .

vilket ger att

32

£

d , och eftersom det ska vara en övre begränsning gäller att

32 ˆ =

d .

Lod-värdet beräknas sedan med den linjära modellen, LOD=log10

(

1+gZ

)

( ) ( ( ) )

0,5294

Nu kan vi beräkna LOD-värdet:

(

1 3 2*0,625

)

0,247

log10 + =

= LOD

Eftersom LOD-värdet är större än noll tyder det på att det finns viss koppling till mellan sjukdomslokuset och den aktuella markören. Givetvis kan man inte dra några säkra slutsatser då beräkningarna endast sker med en familj. I examensarbetet har vi gjort på motsvarande sätt, men med många familjer. I dessa fall blir skattningen d verkligen det värde som maximerar likelihooden och randvilkoret att

ˆ

( )

vd ³0

p gäller då för detta d . ˆ

7 Resultat

En sammanställning av LOD-värden från Allegro gjorde vi i form av diagram (se Bilaga 1 - Diagram). För att lättare kunna titta på resultaten har vi delat upp de sex fenotyperna i två grupper med tre i varje grupp. På varje diagram finns alltså tre fenotyper.

Ena gruppen är:

AER–Njurens albuminfiltrering HT – högt blodtryck,

hTG – höga triglyseridvärden och den andra är:

lHDL-låga värden av det goda kolesterolet NIDDM-diabetes

UR-urinsyra.

För varje fenotyp har vi gjort både enpunktsanalyser och flerpunktsanalyser. De prickade kurvorna visar enpunktsanlyserna, varje punkt är en markör, och de heldragna linjerna är flerpunktsanalyser. LOD-värdesskalan finns på y-axeln och x-axeln visar kromosomens längd mätt i cM (centi Morgan). Vi har valt att redovisa LOD-värden beräknade med den linjära modellen och med lika vikter för alla familjer. För att begränsa antalet diagram har vi endast med de fenotyper och kromosomer som har uppvisat viss koppling.

Det är intressant att titta på de markörer där både enpunkts och flerpunktsanalysen visar på koppling. Oftast ger enpunktsanalysen ett högre värde. Om LOD-värdet är högt i en punkt i enpunktsanalysen och noll i de runt om bör man undersöka detta värde, det kan vara så att den genetiska faktorn, d, är negativ. Då är antalet alleler delade IBD mindre än förväntat och då gäller inte koppling.

För fenotypen hTG (se Bilaga 1, Diagram 6) har vi funnit det högsta LOD-värdet nämligen

Related documents