Lärare 2
Lärare 1
Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband
Jämföra i tid och rum
Lärare 2
Att utföra undersökningar Sneda statistiska underlag Störande faktorer
Hypotestester Placebo effekt
Blindtester av läkemedel
1 Lärare 2– FK2005 – HT2013
Lärare 3
Vetenskap och pseudovetenskap Hur man inte ska avfärda
Att känna igen pseudovetenskap Poissonfördelning
Simulering av vardagliga problem Tillämpnig på trafikflöde
Lärare 4
Felaktiga upptäckter i historia Den vetenskapliga metoden
Lärare 5
Analys av en statisktisk undersökning Bemöta spådomar om världens undergång Analys av protokollet för ett test av rutgängare Analys av en recension och stickprovmetodik
Översikt
Snedvridna undersökningar Störande faktorer
Population och stickprov
Urvalskriterier för stickprov Observationer och experiment Sammanblandning av effekter
Placebo effekt eller förväntanseffekt Blind och dubbelblindtest
2 Lärare 2– FK2005 – HT2013
Snedvridna undersökningar och störande faktorer
Populationen inte den avsedda En läkare önskar undersöka alla
som genomgått magsårsoperation vid ett stort sjukhus under en viss tidsperiod.
Genom brev, telefonsamtal och besök kom han i kontakt med 70% och undersökte dessa.
Den population han studerade blev följaktigen inte den avsedda, och iakttagelserna kan troligen inte generaliseras till den
avsedda större populationen. Varför inte?
3 Lärare 2– FK2005 – HT2013
Snedvridna undersökningar och störande faktorer
Populationen inte den avsedda En läkare önskar undersöka alla
som genomgått magsårsoperation vid ett stort sjukhus under en viss tidsperiod.
Genom brev, telefonsamtal och besök kom han i kontakt med 70% och undersökte dessa.
4 Lärare 2– FK2005 – HT2013
Magsår kan var livshotande.
Patienter som avlidit kan inte kontaktas och kommer därmed inte i undersökningen.
Av olika skäl vill inte patienterna prata med just denna läkare.
5 Lärare 2– FK2005 – HT2013
Resultat från den undersökta gruppen (70% av alla)
⇒ 39 % mår bättre, 26% mår sämre.
Binomial fördelning med p=0.39, n = 115
n x p x (1-p) = 27 > 10 => kan approximeras med normalfödelning.
det statistiska felet på 45 personer är
⇒
⇒
6 Lärare 2– FK2005 – HT2013
Mår sämre Ingen
förändring
Mår bättre Antalet undersökta
30 40 45 115
€
σ = np(1 − p)
€
σ = 115 × 0.39 × 0.61 = 27 = 5 patienter
€
45 ± 5 patienter ⇒ (39 ± 4)%
€
(26 ± 4)%
mår bättre mår sämre
signifikans ~2.3 standard avvikelser.
I verkligheten är det 164 patienter som blev behandlade av denna läkare.
Om man lägger ihop undersökta och icke undersökta:
7 Lärare 2– FK2005 – HT2013
Mår sämre Ingen
förändring
Mår bättre Antalet icke undersökta
39 9 1 49
Mår sämre Ingen
förändring
Mår bättre Alla
Antalet personer 69 49 46 164
6 6 6
€
σ = np(1 − p)
Man skulle kunna skriva så här men vi har undersökt HELA populationen, då finns det ingen ingen statistisk osäkerhet nu.
42±4% mår sämre
28±4% mår bättre 42% mår sämre
28% mår bättre felet behövs om man försöker lära sig
något om hela befolkningen rån ett stickprov Icke undersökta:
inget binomial fel eftersomvi tittade
på hela befolkningen
Läkarens undersökning misslyckades pga en snedvriden undersökning.
Ett representativt stickprov hade gett ett bättre svar Vi betraktar ett stickprov med n=40 patienter.
8 Lärare 2– FK2005 – HT2013
h_bin_baettre Entries 10000 Mean 17.35 RMS 3.119
0 5 10 15 20 25 30 35 40 45
0 200 400 600 800 1000 1200
h_bin_baettre Entries 10000 Mean 17.35 RMS 3.119
Better
stickprov storlek n=40
10 000 undersökningar psämre= 0,42
Man kan se att det mest sannolika antal är 17 (=42%)
Men det händer att man har färre eller flera som säger sig må sämre i stickprovet.
Text bara 0.74% av dessa 10 000 undersökning leder till (antalet mår sämre)>25 (>62%)
Det som är avgörande är inte att man nått alla.
Men att man nått alla som man försökt nå!
Om man väljer patienter slumpmässigt då borde stickprovet bara representativt.
Men det är viktigt att en mycket hög andel av dem personerna som valdes för stickprovet verkligen undersöks.
Om man tittar på undersökningar från Statistiska Centralbyrån så anges andelen som inte svarade på undersökningen.
9 Lärare 2– FK2005 – HT2013
hela populationen
utvalda att vara med i stickprovundersöknigen
som fick verkligen vara med i undersökningen
10 Lärare 2– FK2005 – HT2013
Störande faktorer (2)
En forskare fann att frekvensen av en viss sjukdom hos modern var minst om förlossningen skedde i hemmet, större om den skedde på en vanlig sjukhusavdelning och störst om den skedde på en specialavdelning.
Bevisar det att det är säkrast att födda barn hemma?
11 Lärare 2– FK2005 – HT2013
Störande faktorer (2)
En forskare fann att frekvensen av en viss sjukdom hos modern var 1) minst om förlossningen skedde i hemmet, 2) större om den skedde på en vanlig sjukhusavdelning och 3) störst om den skedde på en specialavdelning.
Bevisar det att det är säkrast att födda barn hemma?
Det är också mer sannolikt att sjukdomen upptäcks på specialavdelning.
Det är också mer sannolikt att förlossningen sker på specialavdelning om det redan fanns ett känt problem.
12 Lärare 2– FK2005 – HT2013
Den verkliga frågan
“Ska fölossningen ske hemma/ sjukhus om man villa vara på den säkra sidan?”
Då måste man jämföra för en grupp kvinnor av samma ålder och med samma underliggande hälsa.
hela populationen
i hemmet
vanlig sjukhusavdelning
specialavdelning 3 grupper
grupp med sjukdomen
hela populationen
i hemmet
vanlig sjukhusavdelning
specialavdelning
kvinnor i en samma åldergrupp
utan känd sjukdom innan förlossningen
Man behöver bygga jämförbara kategorier!
Felaktig stickprovstagning
16
En amatörstatisktiker ville undersöka
förhållanden i ett län hos familjer med barn i skolålder och ville därför ta ut ett slumpmässigt stickprov av sådana familjer.
Eftersom han inte hade någon lista över dessa, kom han på idén att istället slumpmässigt välja ut ett antal barn i länetsskolor och kontakta
ifrågavarande familjer.
Lärare 2– FK2005 – HT2013
Felaktig stickprovstagning
Han tänkte därvid inte att familjer med många barn får större
chans att bli representerade än familjer med få barn; stickprovet av familjer blir alltså inte slumpmässigt. Snedvridet stickprov
Frågar man i undersökningen varje familj hur många bar de har i skolan, kan man då korrigera resultatet => KONTROLLFRÅGA
17
En amatörstatisktiker ville undersöka
förhållanden i ett län hos familjer med barn i skolålder och ville därför ta ut ett slumpmässigt stickprov av sådana familjer.
Eftersom han inte hade någon lista över dessa, kom han på idén att istället slumpmässigt välja ut ett antal barn i länetsskolor och kontakta
ifrågavarande familjer.
Lärare 2– FK2005 – HT2013
Population
Populationen i en statistisk studie är den fullständiga gruppen människor eller element (behöver inte vara människor) som ska studeras.
Population egenskaper är specifika egenskaper hos denna grupp.
18 Lärare 2– FK2005 – HT2013
Population exempel 1
Du arbetar på ett försäkringsbolag
och har som uppdrag att bestämma det genomsnittliga beloppet som betalas ut till olycksoffer utan sidoluftkuddar.
Identifiera målpopulation och några intressanta egenskaper.
19 Lärare 2– FK2005 – HT2013
Population exempel 1
Populationen består av alla människor som tagit emot
försäkringsersättning och som saknar sidoluftkuddar i bilen.
Population egenskapen som är relevant här är det genomsnittliga beloppet.
20 Lärare 2– FK2005 – HT2013
Population exempel 2
Du har blivit anlitad av FastFoodKedja för att bestämma vikten för dem potatis som levereras för att laga pommes frites varje vecka.
Identifiera målpopulation och några intressanta egenskaper.
21 Lärare 2– FK2005 – HT2013
Population exempel 2
Populationen består av alla potatisar som levereras varje vecka för att lagga pommes frites.
Population egenskap:
Man är intresserad av medelvikten men också hur stor spridning det är bland dem (är det stor variation eller tvärtom är alla väldigt nära medelvikten).
22 Lärare 2– FK2005 – HT2013
Population exempel 3
Du är en journalist hos en större TV kanal och ska undersöka om den nya genterapin från Firman X hjälper barn med
leukemia.
Identifiera målpopulation och några intressanta egenskaper.
23 Lärare 2– FK2005 – HT2013
Population exempel 3
Populationen består av alla barn som har leukemia och fått den nya terapin.
Viktiga egenskaper hos populationen är andelen barn som blir friska utan den nya terapin och med den nya terapin.
24 Lärare 2– FK2005 – HT2013
För att besvara dessa frågor kan man:
1. fråga alla människor som tagit emot försäkringsersättning och som saknar sidoluftkuddar i bilen.
2. mäta vikten för varje potatis som levereras för att lagga pommes frites
3. prata med alla barn som har leukemi och fått genterapin
Det är ofta opraktiskt och onödigt att undersöka hela populationen.
25 Lärare 2– FK2005 – HT2013
Stickprov
Ett stickprov är ett mindre urval ur en population, där man kan faktiskt mätta/få svar.
De aktuella svaren eller mätningarna från stickprovet utgör rådata (obehandlad data).
Stickprov statistik: är en egenskap hos stickprovet, eg. man väger ett stickprov av 100 potatis (fortfarande till för pommes frites) och då får man medelvikten och standardavvikelsen hos
stickprovet.
26 Lärare 2– FK2005 – HT2013
hela populationen
utvalda att vara med i stickprovundersöknigen
som fick verkligen vara med i undersökningen
27 Lärare 2– FK2005 – HT2013
egenskap i denna grupp är stickprov
statistik
Arbetslöshet
I USA definierar man arbetskraften som alla som arbetar eller aktivt söker arbete.
Varje månad publiceras andelen arbetslösa, som ska vara andelen av belkokning som aktivt söker arbete, bland den aktiva
befolkningen.
De undersöker 60 000 familjer varje månad.
Identifiera:
a) population b) stickprovet
c) rådata d) stickprov statistik e) populationsegenskap
28 Lärare 2– FK2005 – HT2013
Arbetslöshet (2)
a) population
arbetskraften dvs alla som antingen arbetar eller aktivt söker arbete.
b) stickprov
alla människor som tillhör alla 60,000 familjer c) rådata
antalet arbetslösa och i arbestkraften i stickprovet.
d) stickprov statistik
arbetslösheten (härled mängd!) i stickprovet, dvs andelen arbetslösa i stickprovet.
e) populationsegenskap
arbetslösheten i hela arbetskraften (härleds från stickprovet)
29 Lärare 2– FK2005 – HT2013
Från stickprovet till populationen
I förra lektionen såg vi tex hur man kan ifrån ett stickprov av 1000 väljare härleda en uppskattning med felstapel av stödet för ett parti.
Population:
alla röstberättigade i Sverige
Stickprov:
1000 utvalda personer
Rådata:
antalet som stödjer parti p=a,b,c,… i stickprovet
Stickprov statistik:
partistöd s(p) i stickprovet
Populationsegenskap:
det sanna stödet S(p) i hela populationen dvs i hela den röstberättigade delen av befolkningen (man vet aldrig exakt vad det är förutom vid ett val).
s(p)-σ < Sanna stödet för parti (p) < s(p)+σ med 68% sannolikhet s(p)-2σ < Sanna stödet för parti (p) < s(p)+2σ med 95% sannolikhet
σ = standardavvikelsen (som beräknas med binomialfördelning eller normal fördelning)
30
Start
Population Stickprov
Populations- egenskap
Stickprov egenskap identifiera mål
urval
samla rådata
behandla rådata dra slutsats om
hela populationen
31 Lärare 2– FK2005 – HT2013
Urvalskriterier för stickprov
Om man undersöker hela populationen så handlar det om en folkräkning eller “census”.
Oftast kan man inte undersöka hela populationen.
Man måste istället hitta ett representativt stickprov
Ett representativt stickprov är ett urval av
populationselement som har samma allmänna egenskaper som hela populationen.
32 Lärare 2– FK2005 – HT2013
Stickprov exempel
Man vill bestämma medellängden hos manliga elever i en skola behöver man ett stickprov.
Vem ska man välja?
Killarna i basketball laget?
Alla killar i statistikkursen?
Ingen anledningen (?) att de som går statistik kursen skulle vara längre eller kortare
än resten av populationen.
⇒ Representativt stickprov.
⇒ Basketspelarna utgör ett snedvridet stickprov
33 Lärare 2– FK2005 – HT2013
Snedvriden undersökning
En statistisk studie sägs vara snedvriden i dess utformning eller utförande, om den förvränger populationens egenskaper.
Tex:
1. Ett stickprov är snedvridet om alla element i stickprovet skiljer sig på något sätt från den allmänna populationen.
2. En forskare gynnas eller missgynnas av ett visst resultat, då kan forskaren medvetet eller omedvetet påverka resultatet.
3. Rådatan kan i sig vara snedvriden, om den samlas på ett sätt som kan påverka utslaget (eg. hur ställs frågan?)
4. En studie kan vara korrekt utförd men presenterat på ett snedvridet sätt.
34
Snedvridet i insamlingen, i metoden, i tolkningen
Lärare 2– FK2005 – HT2013
Sannolikhetsurval
Ett sannolikhetsurval är ett urval där alla enheter eller
individer i en population har en känd sannolikhet (ej 0) att bli utvalda i urvalet.
I ett sannolikhetsurval har alla enheter eller individer en chans att bli utvalda. Om man gör icke sannolikhets baserade urval har inte alla enheter eller individer en chans att bli utvalda i urvalet och det leder till förvrängda resultat (bias).
Förvrängda resultat innebär att resultaten inte är representativa för populationen. För att kunna dra tillförlitliga slutsatser för en
population så bör man ha gjort ett sannolikhetsurval.
35 Lärare 2– FK2005 – HT2013
Bra exempel på sannolikhetsurval
Man vill undersöka studenterna, man kan associera en siffra till varje student, och slumpa fram slumptal med en dator eller en miniräknare. Man måste då se till att alla siffror har samma
sannolikhet att bli valda.
36
Dåligt exempel: telefonkatalogen
Telefonkatalogen kommer inte ge samma chans till alla att bli valda i stickprovet. Tex familjer med bara en telefon och med bara ett namn i telefonkatalogen.
Andra använder bara mobilen eller andra har ingen telefon…
⇒ Kan förvränga resultatet
Lärare 2– FK2005 – HT2013
Systematiskt urval
Systematiskt slumpmässigt urval är ett sannolikhetsurval som ibland kan vara att föredra framför enkel
slumpmässigt urval.
Systematiskt slumpmässigt urval innebär att enheterna eller
individerna i populationen arrangeras på ett visst sätt, en startpunkt väljs sedan ut slumpmässigt och sedan väljs var “n:e" medlem av
populationen ut för urvalet.
Om man har en population av fakturor kan systematiskt
slumpmässigt urval vara att föredra. Ett systematiskt slumpmässigt urval skall dock inte användas om arrangemanget av enheter eller individer är i kategorier som inte är slumpmässigt ordnade.
37 Lärare 2– FK2005 – HT2013
Bra exempel på systematiskt surval
I ett museum med en särskild utställning tex om rymden. Man vill frågar besökare om deras åsikter.
Slumpmässigt urval kan vara praktiskt svårt när besökare kommer i grupper.
Med systematiskt urval frågar man tex en person var 10e minuter.
Dåligt exempel
I ett pensionat vill man utföra en undersökning bland eleverna.
Antar att tjejersrum har nummer 0,2,4, och killar 1,3,5,.
Ett systematiskt urval skulle kunna vara: var 4:e rum, om man då börjar med rum 1 då är det bara killar som får delta i
undersökningen.
38 Lärare 2– FK2005 – HT2013
Stratifierat och andra urval
Populationen skiktas efter någon princip och sedan görs ett urval inom varje skikt. Om man tar samma proportion ur varje skikt gör man ett proportionellt urval. Man kan också överrepresentera vissa mindre skikt, icke-proportionellt urval. Kan göras i flera steg.
Gruppurval
Praktiskt urval
39 Lärare 2– FK2005 – HT2013
Observationer och Experiment
I en observationell studie, vi mäter eller observerar vissa egenskaper och samtidigt är försiktiga att inte påverka
egenskaper vi försöker mäta.
Det kan faktiskt gå litet längre än bara observera, om man tex ska väga människor, så måste man be dem att stiga på vågen.
Man växelverkar med personerna i undersökningen men man försöker inte påverka resultatet.
40 Lärare 2– FK2005 – HT2013
Observationer och Experiment (2)
I en medicinisk studie där vi försöker testa om ett läkemedel är verksam, försöker man däremot påverka vad som händer.
Det är vad man kallar ett experiment.
Man försöker fastsälla om det finns ett samband mellan en viss möjlig orsak och möjliga konsekvenser.
41 Lärare 2– FK2005 – HT2013
Salk Polio Vaccin
Det visade sig att 33 barn blev sjuka i testgruppen medan 115 blev sjuka i kontrolgruppen. Efter statistisk
analys, drog man slutsatsen att vaccinet var verksamt.
På 1940-50 talet härjade en stor epidemi av polio
(barnförlamning), många tusen barn varje år blev förlamade av viruset.
1954 utfördes ett stort experiment för att testa om ett vaccin fungerade.
I studien fanns 400000 barn i USA, hälften fick en spruta med det nya preparatet (testgruppen), och hälften fick saltvatten (placebo)
kontrollgruppen.
42 Lärare 2– FK2005 – HT2013
Salk polio vaccin studien är ett experiment där man undersöker sambandet mellan:
Få/ inte få vaccin och antal sjuka barn
Opinionundersöknigar eller dricka 5kaffekoppar studier är observationella studier, där man inte påverkar personerna eller element i studien.
43 Lärare 2– FK2005 – HT2013
Retrospektiva studier
Det kan vara oetiskt att göra vissa experiment, då kan man i vissa fall hitta retrospektivt den data som behövs mha en
observationell studie iställer.
Tex vill man studera effekten av rökning under graviditet.
Man kan knappast be gravida kvinnor att röka för att undersöka vad som händer då, men man kan istället studera tidigare data där kvinnor har rökt under graviditeten.
44 Lärare 2– FK2005 – HT2013
Prospektiva studier
Man kan delvis ersätta
experiment med retrospektiv obsevationell studie.
Det kan också vara så att den data som behövs inte finns, då
startar man en prospektiv studie där man kan tex följa en grupp personer under många år och kartlägga deras vanor och ovanor.
Tex man misstänker att vissa beteenden eller typer av mat kan leda till sjukdomar. Man kan inte heller be folk att leda osunda liv bara för att bevisa ett samband.
45 Lärare 2– FK2005 – HT2013
Experiment
Man vill fastställa om en medicin hjälper då bygger man två grupper:
1) Testgrupp så får den riktiga preparaten.
2) Kontrollgrupp som inte får preparaten.
Det är mycket viktigt att välja dessa grupper på ett slumpmässigt sätt för att minska riska av sneddvridna resultat.
Testgruppen och Kontrollgruppen måste både vara representativa för den allmäna befolkningen.
I exemplet med Salk polio vaccin, var kontrollgruppen den som fick saltvatten spruta.
46 Lärare 2– FK2005 – HT2013
Sammanblandning av effekter
En lärare vill undersöka om det är bättre med samarbete mellan studenter, eller om tvärtom då som jobbar ensamma får bättre resultat.
Läraren delar upp studenterna i 2 grupper under terminen:
en grupp studenter får arbeta i grupper och den andra hälften får jobba var för sig.
Testgruppen består av studenterna som ska samarbeta Kontrollgruppen består av dem ensamma vargarna.
Vid terminens slut får studenterna i testgruppen signifikant bättre betyg än kontrollgruppen
47 Lärare 2– FK2005 – HT2013
Sammanblandning av effekter (2)
Slutsats:
Samarbete fungerar.
48 Lärare 2– FK2005 – HT2013
Sammanblandning av effekter (2)
Slutsats:
Samarbete fungerar.
Eller:
Alla studenter som samarbetade bor på samma pensionat, där de måste lägga sig senast elva på kvällen.
Beror de bättre betygen på grupparbete eller på att de sover bättre?
Detta är ett exempel på sammanblandning av effekter.
Kan undvikas med 1) större statistisk underlag och 2) slumpmässiga urval.
49 Lärare 2– FK2005 – HT2013
Situationen med pensionatet skulle inträffa med större statistiskt underlag och slumpmässigt urval (tex inte låte studenterna bestämma sjävla i vilken grupp de ska ingå)
I Salk Polio vaccin experimentet:
barnen valdes till kontrollgruppen och test gruppen på ett slumpmässigt sätt.
Det var 200,000 barn i varje grupp (kontrol och test).
Sammanblandning av effekter (3)
50 Lärare 2– FK2005 – HT2013
Placebo effekt
En placebo är en låtsas medicin, som tex ett sockerpiller eller en låtsas injection med saltlösning
Fortfarande under debatt om placebo effekt verkligen finns. Vissa studier visar att upp till 75% av de som tar placebo kan bli bättre.
Blir en person frisk pga sjävla preparaten? eller pga att han/hon tror att hon ska bli bättre?
För att undvika sammanblandning av båda effekter jämför man alltid med en kontrollgrupp som får en placebo.
51 Lärare 2– FK2005 – HT2013
Placebo effekt (2)
I Salk Polio vaccin vet inte barnen om de får det nya preparaten eller den saltlösning.
Om läkaren vet vilka patienter får placebo, kan han medevetet eller omedvetet påverka patienten som kan tex förstå eller gissa eller tror att hon/han får det riktiga preparatet eller inte.
Singelblind experiment = patienten vet inte om han/hon får den riktiga medecinen
Dubbelblind = även läkaren inte vet vad patienten får, igen för att undvika sammanblandade effekter.
52 Lärare 2– FK2005 – HT2013