Beskrivande statistik
Sorina Barza
Department of Mathematics, Karlstad University, Sweden
October 5, 2010
I Vad ¨ar beskrivande statistik?
I Sammanst¨allning av statistiska material
I Grafisk beskrivning
I L¨agesm˚att
I Spridningsm˚att
I Vad ¨ar beskrivande statistik?
I Sammanst¨allning av statistiska material
I Grafisk beskrivning
I L¨agesm˚att
I Spridningsm˚att
I Vad ¨ar beskrivande statistik?
I Sammanst¨allning av statistiska material
I Grafisk beskrivning
I L¨agesm˚att
I Spridningsm˚att
I Vad ¨ar beskrivande statistik?
I Sammanst¨allning av statistiska material
I Grafisk beskrivning
I L¨agesm˚att
I Spridningsm˚att
I Vad ¨ar beskrivande statistik?
I Sammanst¨allning av statistiska material
I Grafisk beskrivning
I L¨agesm˚att
I Spridningsm˚att
Vad ¨ ar beskrivande statistik?
Delen av statistiken som sysslar med insamling (t.ex. internet, telefonintervjuer, fysikaliska m¨attningar, etc.), sammanst¨allning (t.ex. tabeller, grafiska bilder, etc) samt slutsatser och tolkning(hur v¨al man har lyckats med en vis medicin, en f¨orpackning, etc.) av en statistisk material kallas deskriptiv statistik.
Sammanst¨ allning av statistiska material
Frekvenstabell
Ex. F¨oljande statistiska material har samlats in i samband med en trafikr¨akning. Man har r¨aknat de bilar som under 40 p˚a varandra f¨oljande perioder om 2 minuter passerat en viss korsning.
6 4 1 2 2 3 5 4
6 3 2 6 7 5 3 4
4 2 3 8 4 4 2 1
4 5 4 2 6 7 5 4
2 1 2 3 5 3 5 3
Det ¨ar sv˚art fr˚an denna tabell att f˚a en uppfattning om hur antalet passerande bilar har varierat.
Antal bilar Frekvens Relativ frekvens
1 3 3/40≈ 0,08
2 8 8/40≈ 0,20
3 7 7/40≈ 0,18
4 9 9/40≈ 0,23
5 6 6/40 = 0,15
6 4 4/40 = 0,10
7 2 2/40 = 0,05
8 1 1/40≈ 0,03
P 40 ≈ 1
I I f¨orsta kollonen har angivits antalet bilar
I I andra kollonen hur m˚anga g˚anger de olika antalen f¨orekommer. Dessa tal kallas frekvenser
I I tredje kollonen har de relativa frekvenserna angivits. Deras summa ¨ar alltid 1.
I Sammanfattning: Ett statistiskt material best˚ar av observationer. Det antal g˚anger ett visst tal f¨orekommer i materialet kallas frekvens. Om frekvensen divideras med antalet observationer f˚as den relativa frekvensen.
I I f¨orsta kollonen har angivits antalet bilar
I I andra kollonen hur m˚anga g˚anger de olika antalen f¨orekommer. Dessa tal kallas frekvenser
I I tredje kollonen har de relativa frekvenserna angivits. Deras summa ¨ar alltid 1.
I Sammanfattning: Ett statistiskt material best˚ar av observationer. Det antal g˚anger ett visst tal f¨orekommer i materialet kallas frekvens. Om frekvensen divideras med antalet observationer f˚as den relativa frekvensen.
I I f¨orsta kollonen har angivits antalet bilar
I I andra kollonen hur m˚anga g˚anger de olika antalen f¨orekommer. Dessa tal kallas frekvenser
I I tredje kollonen har de relativa frekvenserna angivits. Deras summa ¨ar alltid 1.
I Sammanfattning: Ett statistiskt material best˚ar av observationer. Det antal g˚anger ett visst tal f¨orekommer i materialet kallas frekvens. Om frekvensen divideras med antalet observationer f˚as den relativa frekvensen.
I I f¨orsta kollonen har angivits antalet bilar
I I andra kollonen hur m˚anga g˚anger de olika antalen f¨orekommer. Dessa tal kallas frekvenser
I I tredje kollonen har de relativa frekvenserna angivits. Deras summa ¨ar alltid 1.
I Sammanfattning: Ett statistiskt material best˚ar av observationer. Det antal g˚anger ett visst tal f¨orekommer i materialet kallas frekvens. Om frekvensen divideras med antalet observationer f˚as den relativa frekvensen.
Klassindelning
Ex. Vi best¨ammer l¨angderna av ett parti av 50 skruvar med hj¨alp av en linjal. Som resultat av denna unders¨akning f¨oreligger f¨oljande statistiska material:
11, 2 12, 3 17, 3 13, 2 16, 5 13, 4 17, 0 14, 5 15, 6 13, 4 12, 3 15, 9 14, 0 14, 5 14, 5 15, 6 12, 6 11, 8 12, 9 10, 9 11, 6 11, 4 13, 1 12, 3 13, 7 12, 5 11, 0 11, 4 13, 2 12, 3 13, 0 14, 5 13, 4 14, 3 15, 1 8, 8 16, 3 16, 1 13, 7 10, 3 11, 2 11, 3 10, 5 13, 0 17, 7 14, 2 11, 4 14, 4 9, 9 10, 3 Skruvarnas storlek varierar mellan 8,8 mm-17,7 mm; vi kan s¨aga att m¨attningarna tillh¨or intevallet [8, , 18]. Vi delar detta intervall i 10 delintervall, n¨amligen (8, 9], (9, 10], . . . (17, 18] som vi kallar klasser. F¨oljande tabell visar resultatet av denna klassindelning.
Klass Frekvens Relativ frekvens
8-9 1 1/50=0,02
9-10 1 0,02
10-11 5 0,10
11-12 8 0,16
12-13 9 0,18
13-14 9 0,18
14-15 7 0,14
15-16 4 0,08
16-17 4 0,08
17-18 2 0,04
P 50 1
Grafisk beskrivning av statistisk material
Stolpdiagram-exemplet med bilar. Man kan anv¨anda frekvenser eller relativa frekvenser (detta ska kunna l¨asas i stolpdiagrammet).
(se bild!)
Histogram-passar till statistiska material som sammanstlls i
”klasstabeller”. Ibland kan man ˚ask˚adligg¨ora statistisk material med histogram ritade p˚a ett annat s¨att t.ex. befolkningspyramider.
(se bild)
Summaploygon- vi anv¨ander kumulerade relativa frekvenser. (se bild). Detta ¨ar ett av de b¨asta s¨atten att ˚ask˚adligg¨ora ett statistiskt material. F¨or varje klaass¨andpunkt kan vi l¨asa hur m˚anga observationer som ¨ar mindre eller eller lika med klaass¨andpunkten.
Sektordiagramm (cirkeldiagram), stapeldiagram etc.
L¨ agesm˚ at
Medelv¨arde
L˚at x1, x2, . . . , xk vara tal som f¨orekommer som observationer i en statistisk material med motsvarande frekvenser n1, n2, . . . , nk och n = n1+ n2+ . . . + nk =Pk
i =1ni. D˚a ¨ar medelv¨ardet
x = n1x1+ · · · nkxk
n .
Ex. 1:
material A 1 3 4 5 7
material B 4 6 9 10 11 xA= 4; xB = 8.
Ex. 2: Antalet bilar under 40 tidsintervall om tv˚a minuter:
x = 3, 8.
Median och kvartiller
Medianen f¨or ett statistisk material ordnat efter storlek ¨ar mittobservationen om materialet best˚a r av ett udda antal observationer och den ¨ar medelv¨ardet av de b˚ada
mittobservationerna om materialet omfattar ett j¨amnt antal observationer.
Ex. 1
Material A: 3 3 4 5 8 10 Material B: 3 3 4 5 8 30 B˚ada materialen har medianen 4,5. I material B finns en observation som avviker avsev¨ard fr˚an de andra. Medianen p˚averkas inte av avvikande observationer n˚agot som skjlier denna m˚att fr˚an medelv¨ardet! Medelv¨arden f¨or Material A ¨ar 5,5 medan f¨or material B ¨ar 10,5.
Ex. 2 Bilarna: medelv¨ardet 3,8; medianen 4.
Medianen f¨or ett kalssindelat material F¨or ett klassindelat material kan vi inte ber¨akna medianen enligt medtoden ovan s˚avida vi inte
¨ar beredda att g˚atillbaka till de ursprungliga observationerna och ordna de i storleksordning. Observera att de kan vara extremt m˚anga! Vi definierar medianen i detta fall som x-koordinatan av punkten p˚a summapolygonen som har y-koordinatan 0,50.
Ex. Skruvar! Medianen 13,1. Detta betyder att 50 procent av skruvarna ¨ar kortare ¨an 13,5 mm.
Spridningsm˚ att
Variationsbredd= differensen mellan den st¨orsta och minsta observationen.
Varians och standard avvikelse
Ex.Vi betraktar det statistiska materialet 1 3 5 8 9 10.
Medelv¨ardet ¨ar 6 Vi ber¨aknar nu avvikelsen mellan varje observation och medelvrdet, dvs vi minskar med 6 alla
observationer. Vi kvadrerar avvikelserna, ber¨aknar summan av dessa kvadrater och dividerar summan med 5 (antalet
observationer -1). Talet som vi f˚ar ¨ar 12,8 och kallas materialets varians och betecknas med s2. Ju st¨ore spridning desto st¨ore varians. Vill man ha samma m˚attenhet som p˚a m¨attningar anv¨ander vi s =√
s2 som kallas materialets standardavvikelse.
varians:s2 = 1 n − 1
n
X
i =1
(xi− x)2
standard avvikelse:s =
√ s2
Betydelsen av standardavvikelse
Cebyshev’s (Hitta detta namn i olika medier och g¨or en statistisk material p˚a hur den stavas!) olikhet:
Utanf¨or intervallet x − 2s, x + 2s kan h¨ogst 1/4 av observationerna (m¨atnigarna) ligga.
Utanf¨or intervallet x − 3s, x + 3s kan h¨ogst 1/9 av observationerna (m¨atnigarna) ligga. osv.
Utanf¨or intervallet x − ns, x + ns kan h¨ogst 1/n2 av observationerna (m¨atnigarna) ligga.
Uppgifter
Upp. 1 Vid en slutkontroll av en viss typ av DVD-apprater
r¨aknade man antalet fel hos 30 av dessa. Man erh¨oll f¨oljande antal fel : 3, 3, 0, 1, 0, 2, 0, 1, 2, 1, 1, 1, 1, 0, 2, 0, 0, 3, 2, 1, 2, 1, 1, 0, 1, 2, 1, 1, 2, 1. Konstruerra en fekvenstabell.
Upp. 2 F¨oljande tabell visar erh˚allna po¨ang vid kast med en t¨arning. Konstruera frekvenstabell.
1 4 6 3 6 6 5 6 1 4 1 3 3 5 3 6 5 5 4 6
2 1 6 2 5 3 6 2 4 2 2 2 6 3 3 2 6 3 6 6
1 3 5 6 6 2 1 5 3 4 6 4 3 6 1 2 2 2 5 6
Upp. 3 F¨oljande tabell visar m¨angden ¨aggvita i blodet hos 50 personer. G¨or en klassindelning av detta material med lika breda klasser.
7, 61 7, 15 7, 42 7, 47 7, 81 7, 28 7, 07 7, 15 7, 14 7, 59 7, 42 7, 40 7, 33 7, 54 7, 18 6, 98 7, 45 7, 24 7, 34 7, 25 7, 12 7, 54 7, 40 7, 36 7, 34 7, 33 7, 52 7, 00 7, 54 7, 25 7, 60 7, 36 7, 49 7, 40 7, 15 7, 51 7, 32 7, 56 7, 20 7, 16 6, 95 6.97 7, 24 7, 07 7, 25 7, 62 7, 33 7, 41 7, 65 7, 07
Upp. 4 Rita en stolpdiagram till Uppgifterna 1 och 2.
Upp. 5 Rita en histogram till Upp. 3.
Upp. 6 Rita summaplygonet till materialet i uppgiften 3.
Upp. 7 Ber¨akna medelv¨ardena f¨or materialen i upp. 1, 2, 3.
Upp. 8 Ber¨akna medianen f¨or statistiska materialen givna i Upp.
1, 2, 3.
Upp. 9 Ber¨akna standardavvikelsen f¨or materialen i Upp. 1, 2, 3.