F¨or ett datamaterial av n talpar (x1, y1), (x2, y2), . . . , (xn, yn) definieras kovariansen av Kov = 1
n− 1
n
X
i=1
(xi− x)(yi− y) och korrelationskoefficienten av
ρ = Kov sxsy
d¨ar sx =qn−11 Pni=1(xi− x)2 ¨ar standardavvikelsen f¨or xi-v¨ardena och motsvarande f¨or sy. Om man utnyttjar att Pni=1(xi − x) = Pni=1xi− nx = nx − nx = 0 erh˚aller man alternativa s¨att att ber¨akna Kov:
Kov = 1
n− 1
n
X
i=1
(xi− x)(yi− y) = 1 n− 1
n
X
i=1
(xi− x)yi− y 1 n− 1
n
X
i=1
(xi− x)
= 1
n− 1
n
X
i=1
(xi− x)yi = 1 n− 1
n
X
i=1
xiyi− nx y
.
F¨or att visa att korrelationskoefficienten ligger mellan −1 och +1 kan man utnyttja Schwartz olikhet:
Sats L˚at a1, a2, . . . , an och b1, b2, . . . , bn var godtyckliga rellea tal. D˚a ¨ar
n
X
i=1
aibi
2
≤
n
X
i=1
a2i
n
X
i=1
b2i. Bevis: L˚at k vara ett godtyckligt tal. Vi har att
0≤
n
X
i=1
(ai− kbi)2=
n
X
i=1
(a2i − 2kaibi+ k2b2i) =
n
X
i=1
a2i − 2k
n
X
i=1
aibi+ k2
n
X
i=1
b2i. Genom att derivera h¨ogerledet med avseende p˚a k erh˚aller man l¨att att minimum f˚as f¨or k =Pni=1aibi/Pni=1b2i. Ins¨atter man detta v¨arde i olikheten erh˚alls
0≤
n
X
i=1
a2i − 2 Pn
i=1aibi
Pn i=1b2i
n
X
i=1
aibi+ Pn
i=1aibi
Pn i=1b2i
!2 n X
i=1
b2i =
n
X
i=1
a2i −(Pni=1aibi)2 Pn
i=1b2i vilket ger satsen.
Man ser ocks˚a direkt fr˚an beviset att likhet f˚as om och endast om ai = kbi, dvs ai:na proportionella mot bi:v¨ardena.
Om man i satsen ovan sedan s¨atter in ai = xi− x och bi = yi− y erh˚alls
ρ2= Kov2 s2xs2y =
1 n− 1
n
X
i=1
(xi− x)(yi− y)
!2
1 n− 1
n
X
i=1
(xi− x)2 1 n− 1
n
X
i=1
(yi− y)2
=
n
X
i=1
(xi− x)(yi− y)
!2
n
X
i=1
(xi− x)2
n
X
i=1
(yi− y)2
≤ 1
1
Likhet f˚as om och endast om xi− x = k(yi− y) dvs om och endast om data ligger p˚a en r¨at linje med lutning k.
2