• No results found

Beskrivande statistik

N/A
N/A
Protected

Academic year: 2022

Share "Beskrivande statistik"

Copied!
25
0
0

Loading.... (view fulltext now)

Full text

(1)

Beskrivande statistik

Sorina Barza

Department of Mathematics, Karlstad University, Sweden

October 5, 2010

(2)

I Vad ¨ar beskrivande statistik?

I Sammanst¨allning av statistiska material

I Grafisk beskrivning

I L¨agesm˚att

I Spridningsm˚att

(3)

I Vad ¨ar beskrivande statistik?

I Sammanst¨allning av statistiska material

I Grafisk beskrivning

I L¨agesm˚att

I Spridningsm˚att

(4)

I Vad ¨ar beskrivande statistik?

I Sammanst¨allning av statistiska material

I Grafisk beskrivning

I L¨agesm˚att

I Spridningsm˚att

(5)

I Vad ¨ar beskrivande statistik?

I Sammanst¨allning av statistiska material

I Grafisk beskrivning

I L¨agesm˚att

I Spridningsm˚att

(6)

I Vad ¨ar beskrivande statistik?

I Sammanst¨allning av statistiska material

I Grafisk beskrivning

I L¨agesm˚att

I Spridningsm˚att

(7)

Vad ¨ ar beskrivande statistik?

Delen av statistiken som sysslar med insamling (t.ex. internet, telefonintervjuer, fysikaliska m¨attningar, etc.), sammanst¨allning (t.ex. tabeller, grafiska bilder, etc) samt slutsatser och tolkning(hur v¨al man har lyckats med en vis medicin, en f¨orpackning, etc.) av en statistisk material kallas deskriptiv statistik.

(8)

Sammanst¨ allning av statistiska material

Frekvenstabell

Ex. F¨oljande statistiska material har samlats in i samband med en trafikr¨akning. Man har r¨aknat de bilar som under 40 p˚a varandra f¨oljande perioder om 2 minuter passerat en viss korsning.

6 4 1 2 2 3 5 4

6 3 2 6 7 5 3 4

4 2 3 8 4 4 2 1

4 5 4 2 6 7 5 4

2 1 2 3 5 3 5 3

Det ¨ar sv˚art fr˚an denna tabell att f˚a en uppfattning om hur antalet passerande bilar har varierat.

(9)

Antal bilar Frekvens Relativ frekvens

1 3 3/40≈ 0,08

2 8 8/40≈ 0,20

3 7 7/40≈ 0,18

4 9 9/40≈ 0,23

5 6 6/40 = 0,15

6 4 4/40 = 0,10

7 2 2/40 = 0,05

8 1 1/40≈ 0,03

P 40 ≈ 1

(10)

I I f¨orsta kollonen har angivits antalet bilar

I I andra kollonen hur m˚anga g˚anger de olika antalen f¨orekommer. Dessa tal kallas frekvenser

I I tredje kollonen har de relativa frekvenserna angivits. Deras summa ¨ar alltid 1.

I Sammanfattning: Ett statistiskt material best˚ar av observationer. Det antal g˚anger ett visst tal f¨orekommer i materialet kallas frekvens. Om frekvensen divideras med antalet observationer f˚as den relativa frekvensen.

(11)

I I f¨orsta kollonen har angivits antalet bilar

I I andra kollonen hur m˚anga g˚anger de olika antalen f¨orekommer. Dessa tal kallas frekvenser

I I tredje kollonen har de relativa frekvenserna angivits. Deras summa ¨ar alltid 1.

I Sammanfattning: Ett statistiskt material best˚ar av observationer. Det antal g˚anger ett visst tal f¨orekommer i materialet kallas frekvens. Om frekvensen divideras med antalet observationer f˚as den relativa frekvensen.

(12)

I I f¨orsta kollonen har angivits antalet bilar

I I andra kollonen hur m˚anga g˚anger de olika antalen f¨orekommer. Dessa tal kallas frekvenser

I I tredje kollonen har de relativa frekvenserna angivits. Deras summa ¨ar alltid 1.

I Sammanfattning: Ett statistiskt material best˚ar av observationer. Det antal g˚anger ett visst tal f¨orekommer i materialet kallas frekvens. Om frekvensen divideras med antalet observationer f˚as den relativa frekvensen.

(13)

I I f¨orsta kollonen har angivits antalet bilar

I I andra kollonen hur m˚anga g˚anger de olika antalen f¨orekommer. Dessa tal kallas frekvenser

I I tredje kollonen har de relativa frekvenserna angivits. Deras summa ¨ar alltid 1.

I Sammanfattning: Ett statistiskt material best˚ar av observationer. Det antal g˚anger ett visst tal f¨orekommer i materialet kallas frekvens. Om frekvensen divideras med antalet observationer f˚as den relativa frekvensen.

(14)

Klassindelning

Ex. Vi best¨ammer l¨angderna av ett parti av 50 skruvar med hj¨alp av en linjal. Som resultat av denna unders¨akning f¨oreligger f¨oljande statistiska material:

11, 2 12, 3 17, 3 13, 2 16, 5 13, 4 17, 0 14, 5 15, 6 13, 4 12, 3 15, 9 14, 0 14, 5 14, 5 15, 6 12, 6 11, 8 12, 9 10, 9 11, 6 11, 4 13, 1 12, 3 13, 7 12, 5 11, 0 11, 4 13, 2 12, 3 13, 0 14, 5 13, 4 14, 3 15, 1 8, 8 16, 3 16, 1 13, 7 10, 3 11, 2 11, 3 10, 5 13, 0 17, 7 14, 2 11, 4 14, 4 9, 9 10, 3 Skruvarnas storlek varierar mellan 8,8 mm-17,7 mm; vi kan s¨aga att m¨attningarna tillh¨or intevallet [8, , 18]. Vi delar detta intervall i 10 delintervall, n¨amligen (8, 9], (9, 10], . . . (17, 18] som vi kallar klasser. F¨oljande tabell visar resultatet av denna klassindelning.

(15)

Klass Frekvens Relativ frekvens

8-9 1 1/50=0,02

9-10 1 0,02

10-11 5 0,10

11-12 8 0,16

12-13 9 0,18

13-14 9 0,18

14-15 7 0,14

15-16 4 0,08

16-17 4 0,08

17-18 2 0,04

P 50 1

(16)

Grafisk beskrivning av statistisk material

Stolpdiagram-exemplet med bilar. Man kan anv¨anda frekvenser eller relativa frekvenser (detta ska kunna l¨asas i stolpdiagrammet).

(se bild!)

(17)

Histogram-passar till statistiska material som sammanstlls i

”klasstabeller”. Ibland kan man ˚ask˚adligg¨ora statistisk material med histogram ritade p˚a ett annat s¨att t.ex. befolkningspyramider.

(se bild)

(18)

Summaploygon- vi anv¨ander kumulerade relativa frekvenser. (se bild). Detta ¨ar ett av de b¨asta s¨atten att ˚ask˚adligg¨ora ett statistiskt material. F¨or varje klaass¨andpunkt kan vi l¨asa hur m˚anga observationer som ¨ar mindre eller eller lika med klaass¨andpunkten.

Sektordiagramm (cirkeldiagram), stapeldiagram etc.

(19)

L¨ agesm˚ at

Medelv¨arde

L˚at x1, x2, . . . , xk vara tal som f¨orekommer som observationer i en statistisk material med motsvarande frekvenser n1, n2, . . . , nk och n = n1+ n2+ . . . + nk =Pk

i =1ni. D˚a ¨ar medelv¨ardet

x = n1x1+ · · · nkxk

n .

Ex. 1:

material A 1 3 4 5 7

material B 4 6 9 10 11 xA= 4; xB = 8.

Ex. 2: Antalet bilar under 40 tidsintervall om tv˚a minuter:

x = 3, 8.

(20)

Median och kvartiller

Medianen f¨or ett statistisk material ordnat efter storlek ¨ar mittobservationen om materialet best˚a r av ett udda antal observationer och den ¨ar medelv¨ardet av de b˚ada

mittobservationerna om materialet omfattar ett j¨amnt antal observationer.

Ex. 1

Material A: 3 3 4 5 8 10 Material B: 3 3 4 5 8 30 B˚ada materialen har medianen 4,5. I material B finns en observation som avviker avsev¨ard fr˚an de andra. Medianen p˚averkas inte av avvikande observationer n˚agot som skjlier denna m˚att fr˚an medelv¨ardet! Medelv¨arden f¨or Material A ¨ar 5,5 medan f¨or material B ¨ar 10,5.

Ex. 2 Bilarna: medelv¨ardet 3,8; medianen 4.

(21)

Medianen f¨or ett kalssindelat material F¨or ett klassindelat material kan vi inte ber¨akna medianen enligt medtoden ovan s˚avida vi inte

¨ar beredda att g˚atillbaka till de ursprungliga observationerna och ordna de i storleksordning. Observera att de kan vara extremt m˚anga! Vi definierar medianen i detta fall som x-koordinatan av punkten p˚a summapolygonen som har y-koordinatan 0,50.

Ex. Skruvar! Medianen 13,1. Detta betyder att 50 procent av skruvarna ¨ar kortare ¨an 13,5 mm.

(22)

Spridningsm˚ att

Variationsbredd= differensen mellan den st¨orsta och minsta observationen.

Varians och standard avvikelse

Ex.Vi betraktar det statistiska materialet 1 3 5 8 9 10.

Medelv¨ardet ¨ar 6 Vi ber¨aknar nu avvikelsen mellan varje observation och medelvrdet, dvs vi minskar med 6 alla

observationer. Vi kvadrerar avvikelserna, ber¨aknar summan av dessa kvadrater och dividerar summan med 5 (antalet

observationer -1). Talet som vi f˚ar ¨ar 12,8 och kallas materialets varians och betecknas med s2. Ju st¨ore spridning desto st¨ore varians. Vill man ha samma m˚attenhet som p˚a m¨attningar anv¨ander vi s =√

s2 som kallas materialets standardavvikelse.

varians:s2 = 1 n − 1

n

X

i =1

(xi− x)2

standard avvikelse:s =

√ s2

(23)

Betydelsen av standardavvikelse

Cebyshev’s (Hitta detta namn i olika medier och g¨or en statistisk material p˚a hur den stavas!) olikhet:

Utanf¨or intervallet x − 2s, x + 2s kan h¨ogst 1/4 av observationerna (m¨atnigarna) ligga.

Utanf¨or intervallet x − 3s, x + 3s kan h¨ogst 1/9 av observationerna (m¨atnigarna) ligga. osv.

Utanf¨or intervallet x − ns, x + ns kan h¨ogst 1/n2 av observationerna (m¨atnigarna) ligga.

(24)

Uppgifter

Upp. 1 Vid en slutkontroll av en viss typ av DVD-apprater

r¨aknade man antalet fel hos 30 av dessa. Man erh¨oll f¨oljande antal fel : 3, 3, 0, 1, 0, 2, 0, 1, 2, 1, 1, 1, 1, 0, 2, 0, 0, 3, 2, 1, 2, 1, 1, 0, 1, 2, 1, 1, 2, 1. Konstruerra en fekvenstabell.

Upp. 2 F¨oljande tabell visar erh˚allna po¨ang vid kast med en t¨arning. Konstruera frekvenstabell.

1 4 6 3 6 6 5 6 1 4 1 3 3 5 3 6 5 5 4 6

2 1 6 2 5 3 6 2 4 2 2 2 6 3 3 2 6 3 6 6

1 3 5 6 6 2 1 5 3 4 6 4 3 6 1 2 2 2 5 6

Upp. 3 F¨oljande tabell visar m¨angden ¨aggvita i blodet hos 50 personer. G¨or en klassindelning av detta material med lika breda klasser.

7, 61 7, 15 7, 42 7, 47 7, 81 7, 28 7, 07 7, 15 7, 14 7, 59 7, 42 7, 40 7, 33 7, 54 7, 18 6, 98 7, 45 7, 24 7, 34 7, 25 7, 12 7, 54 7, 40 7, 36 7, 34 7, 33 7, 52 7, 00 7, 54 7, 25 7, 60 7, 36 7, 49 7, 40 7, 15 7, 51 7, 32 7, 56 7, 20 7, 16 6, 95 6.97 7, 24 7, 07 7, 25 7, 62 7, 33 7, 41 7, 65 7, 07

(25)

Upp. 4 Rita en stolpdiagram till Uppgifterna 1 och 2.

Upp. 5 Rita en histogram till Upp. 3.

Upp. 6 Rita summaplygonet till materialet i uppgiften 3.

Upp. 7 Ber¨akna medelv¨ardena f¨or materialen i upp. 1, 2, 3.

Upp. 8 Ber¨akna medianen f¨or statistiska materialen givna i Upp.

1, 2, 3.

Upp. 9 Ber¨akna standardavvikelsen f¨or materialen i Upp. 1, 2, 3.

References

Related documents

ningar av dcn lokala faunan kan vara av stort intresse och ge lika stor tillfredsstallelse sonl att aka land och rikc runt pa jakt cftcr raritctcr till den privata

D¨arf¨or ¨ar 2X exponentialf¨ordelad, med v¨antev¨arde 2a, vilket ¨ar samma f¨ordelning som f¨or Y.. Uppgiften ¨ar egentligen felformulerad; det ¨ar signifikansnniv˚an 1%

Visa att det finns en och samma vektor (olika nollvektorn) som ligger i alla

[r]

[r]

Det ¨ ar en mots¨ agelse till att vi f˚ ar stryka alla gemensamma faktorer och d¨ arf¨ or ¨ ar x irrationellt.. (a) Skissa grafen av den trigonometriska

Po¨ angen p˚ a godk¨ anda duggor summeras och avg¨ or slutbetyget.. L¨ osningarna skall vara v¨ almotiverade och

Du m˚ aste inte r¨ akna ut eventuella potenser i de tv˚ a