Reproducerbarhet av p-v¨arden: en simulerings- studie
Examensarbete f¨ or kandidatexamen i matematik vid G¨ oteborgs universitet Kandidatarbete inom civilingenj¨ orsutbildningen vid Chalmers tekniska h¨ ogskola
Milton Bark
Lina Hammargren Carl Larsson
William Nils´en
Institutionen f¨ or Matematiska vetenskaper
CHALMERS TEKNISKA H ¨ OGSKOLA
Reproducerbarhet av p-v¨arden: en simuleringsstudie
Examensarbete f¨ or kandidatexamen i matematisk statistik vid G¨ oteborgs universitet Lina Hammargren William Nils´ en
Kandidatarbete i matematik inom civilingenj¨ orsprogrammet Maskinteknik vid Chal- mers tekniska h¨ ogskola
Milton Bark Carl Larsson
Handledare: Serik Sagitov
Examinator: Ulla Dinger och Maria Roginskaya
Institutionen f¨ or Matematiska vetenskaper
CHALMERS TEKNISKA H ¨ OGSKOLA
G ¨ OTEBORGS UNIVERSITET
Notationslista
H
0H¨ andelsen att stickprovet kommer fr˚ an nollf¨ ordelningen N (µ
0, σ
2)
H
1H¨ andelsen att stickprovet kommer fr˚ an den alternativa f¨ ordelningen N (µ
1, σ
2)
S H¨ andelsen att en studie ¨ ar signifikant och publiceras
B H¨ andelsen att en publicerad studie har omedveten bias
π Andelen av studier d¨ ar stickprovet kommer fr˚ an alternativa f¨ ordelningen, P(H
1)
1 − π Andelen av studier d¨ ar stickprovet kommer fr˚ an nollf¨ ordelningen, P(H
0)
b Andelen av studier som publicerats och har omedveten bias, P(B)
σ Standardavvikelse
n Stickprovsstorlek
Kan vi lita p˚ a forskning?
2005 publicerade John Ioannidis en artikel vars titel l¨ od Why Most Research Findings are False och efter framf¨ orandet av artikeln publicerade m˚ anga andra forskare artiklar inom samma ¨ amnes- omr˚ ade. Denna explosion av nya studier startade en intensiv debatt i vetenskapsv¨ arlden; ¨ ar de statistiska metoder som anv¨ ands inom vetenskaplig forskning i dagsl¨ aget bristf¨ alliga? Precis denna fr˚ aga menade en grupp av blivande ingenj¨ orer och matematiker p˚ a Chalmers- och G¨ oteborgs Uni- versitet att besvara i deras examensarbete. Genom att simulera miljontals studier som efterf¨ oljde dagens statistiska metoder i verklig forskning lyckades gruppen ta fram och konkretisera vissa av dessa debatterade brister.
Studenternas resultat visade att de statistiska metoder dagens vetenskap vilar p˚ a framf¨ or allt har en brist: den m¨ anskliga faktorn. Gruppen visade att det inte hade funnits n˚ agra problem med att anv¨ anda dagens vanligt f¨ orekommande statistiska metoder f¨ or validering av forskningshypoteser under ideella fall. Ett par f˚ a felaktiga procent av studier till f¨ oljt av en felmarginal skulle fortfaran- de publiceras men dessa felaktiga studier skulle snabbt komma till ytan s˚ a l¨ ange som alla forskare delade med sig av samtliga resultat, s˚ av¨ al positiva som negativa. Dessv¨ arre jobbar forskarlag som tar fram studier separat och inte i stora n¨ atverk, det i kombination med en enorm konkurrens g¨ or att negativa resultat inte delas med andra. Bristen p˚ a kommunikation och sammankoppling till˚ ater de f˚ a felaktiga antalet studier att finnas kvar i vetenskapsv¨ arlden d¨ ar fler och fler felaktiga studier ackumuleras.
Studenterna drar slutsatsen i deras uppsats att den d˚ aliga kommunikationen mellan olika forskarlag
¨ ar en f¨ oljd av det mycket st¨ orre problemet ben¨ amnt som publikationsbias. Med publikationsbias menas en f¨ oreliggande stark vilja att bli publicerad. Att forskare har en publikationsbias ¨ ar inte f¨ or- v˚ anade, hur v¨ arderar samh¨ allet en enskild forskare egentligen och hur ser incitamentstrukturen ut f¨ or forskare? Forskare bed¨ oms och bel¨ onas i stor grad efter deras publikationer, b˚ ade i prestige s˚ av¨ al som monet¨ ar kompensation. Denna prestationspress g¨ or troligen m˚ anga forskare omedvetet eller medvetet ben¨ agna att manipulera sin data eller metod f¨ or att ¨ oka sannolikheten att bli publicerade.
Vidare skapade studenterna nya simulerade studier som beaktade olika fall av manipulation av data under de statistiska metoder forskare anv¨ ander sig av i dagsl¨ aget, studenternas slutsats var orov¨ ackande. I princip vilket resultat som helst, oavsett om det st¨ ammer eller inte, kan valideras och konfirmeras n¨ ar det finns medveten bias s˚ a l¨ ange forskaren har tillg˚ ang till tillr¨ ackligt mycket data.
Det finns dock hopp, genom att samla in delar av alla publicerade resultat inom en forskingsfr˚ aga eller forksningsf¨ alt kan en uppskattning g¨ oras om hur mycket fusk som sker inom fr˚ agan eller f¨ altet.
Mot bakgrund av publikationsbias ¨ ar det inte f¨ orv˚ anande att det inom vissa forskningsf¨ alt har det visat sig otroligt sv˚ art att reproducera studier och f˚ a samma utfall. Ett exempel p˚ a bristen av reproducerbara studier har kartlagts i analyser av flera publicerade studier inom bland annat pre- kliniska cancerstudier. Bioteknikf¨ oretaget Amgens visade i ett projekt att de inte kunde replikera 47 av 53 prekliniska cancerstudier.
S˚ a hur kan problemet l¨ osas? Studenterna argumenterade f¨ or att vi m˚ aste g˚ a till roten av problemet
vilket ¨ ar publikationsbias. Att s¨ atta artificiella krav p˚ a tidsskrifter f¨ or att kvotera in replikations-
test i sina tidningar skulle kunna vara en l¨ osning men samtidigt ¨ ar problematiken antagligen mer
djupg˚ aende ¨ an s˚ adan. Tidsskrifter har ett incitament att publicera studier som kommer att at-
trahera l¨ asare som betalar f¨ or tj¨ ansten. Om tidsskrifter inte publicerar replikationsstudier ¨ ar det
antagligen en f¨ oljd utav att de inte genererar lika m˚ anga l¨ asare och d¨ armed s¨ amre int¨ akter. Med den
utg˚ angspunkten blir det extra viktigt att informera l¨ asarna av vikten f¨ or forskning och vetenskap
att studier faktiskt replikeras, d˚ a det ¨ ar l¨ asarnas preferenser som ¨ ar basen till hur vi utv¨ arderar
publikationer.
Bidrag till allm¨ anheten
Ut¨ over den en popul¨ arvetenskapliga artikel som ¨ ar specifik f¨ or arbetet har ¨ aven ett bidrag till den icke-vinstdrivande encyklopedin Wikipedia gjorts. Bidraget har skapats genom att producera och publicera en artikel inom det f¨ alt kandidatarbetet behandlar. Syftet med artikeln ¨ ar att n˚ a ut till en bredare audiens och f¨ orklara delar av problematiken f¨ or allm¨ anheten i verkligheten. Artikeln ¨ ar i enlighet med gruppens och handledarens m˚ al om att st¨ arka den entrepren¨ oriella andan inom det matematiska vetenskapliga ¨ amnet p˚ a Chalmers tekniska h¨ ogskola.
Wikipedia artikeln kan finnas p˚ a https://sv.wikipedia.org/wiki/Replikationskrisen
Sammanfattning
Det h¨ ar kandidatarbetet studerar reproducerbarhet av vetenskapliga studier. ¨ Amnet ¨ ar vik- tigt eftersom det har framkommit att m˚ anga studier inte ¨ ar reproducerbara och s˚ aledes att forskningsresultat kan vara felaktiga. En orsak till icke-reproducerbara studier ¨ ar bias. Bias kan vara medveten d˚ a forskare manipulerar sin forskning i syfte att bli publicerad eller kan vara omedveten som f¨ oljd av att forskaren har en f¨ orutfattad mening av vad resultatet ska bli i en studie.
F¨ or att f˚ a en ¨ oversikt av problemet simulerades ett flertal studier f¨ or att representera ett forskningsf¨ alt. En studie i det h¨ ar arbetet representeras av ett p-v¨ arde som ¨ ar antingen sig- nifikant eller inte signifikant. I det h¨ ar arbetet anv¨ ands en signifikansniv˚ a α = 0.05 f¨ or att best¨ amma om ett p-v¨ arde ¨ ar signifikant. I en studie kan stickprovet komma fr˚ an f¨ ordelningen f¨ or nollhypotesen eller den alternativa hypotesen. Det antas genomg˚ aende i texten vara k¨ ant vilken f¨ ordelning stickprovet kommer ifr˚ an. Detta p˚ a grund av att en viktig del av arbetet ¨ ar att unders¨ oka om det g˚ ar att h¨ arleda om H
0eller H
1f¨ oreligger i en studie. De hypoteser som anv¨ ants i arbetet ¨ ar
H
0:= stickprovet kommer fr˚ an N (0, 5
2) H
1:= stickprovet kommer fr˚ an N (1, 5
2)
Genom grafiska framst¨ allningar unders¨ oks studierna, det vill s¨ aga p-v¨ ardena. F¨ orst unders¨ oks f¨ ordelningarna av p-v¨ ardena under H
0respektive H
1. D¨ arefter implementerades en metod f¨ or medveten bias i syfte att unders¨ oka p˚ averkan av medveten bias p˚ a ett forskningsf¨ alt. Slutligen kombineras p-v¨ ardena under H
0och H
1b˚ ade med och utan medveten bias f¨ or att kunna g¨ ora en mer realistisk bild av verklighetstillst˚ andet.
Den andra formen av bias, omedveten bias, har unders¨ okts med hj¨ alp av det s˚ a kallade posi- tiva prediktiva v¨ ardet (PPV). PPV ¨ ar sannolikheten att H
1f¨ oreligger givet att ett signifikant p-v¨ arde erh˚ allits. Detta arbete betraktade proportionen av studier med omedveten bias som k¨ and.
Anv¨ andningen av bland annat dessa metoder resulterade i grafiska framst¨ allningar och tabeller som visar p˚ a en tydlig skillnad mellan fallen d˚ a bias f¨ orekommer och d˚ a det inte f¨ orekommer.
Resultaten i simuleringen har ¨ aven j¨ amf¨ orts med en verklig studie och bekr¨ aftar resultaten av arbetet.
Slutsatsen av de grafiska representationerna av forskningsf¨ alt ¨ ar att det till exempel g˚ ar att
utr¨ ona att medveten bias f¨ orekommit inom ett forskningsf¨ alt. En vidare slutsats ¨ ar att PPV
p˚ averkas negativt av b˚ ada formerna av bias och antalet studier med signifikanta p-v¨ arden
kommer att ¨ oka d˚ a studier ¨ ar biased inom ett forskningsf¨ alt.
Abstract
The purpose of this bachelor’s thesis is to investigate the reproducibility of scientific studies.
The subject is important due to the debate about the reproducibility issue of studies which indicates that published research findings may be false in several cases. One of the reasons for non-reproducible studies is bias. There are two cases of bias that will be discussed in this the- sis; unconscious and conscious bias. Conscious bias is the act of active manipulation of studies in order to get published, and unconscious bias can arise when scientists are preconceived of a certain outcome before the conduct of a study.
To better understand the problem, several studies were simulated to represent a field of re- search. A study in this thesis will be represented by a p-value that either can be significant or non-significant. This thesis used a significance level of α = 0.05 to decide whether a p-value is significant.
The sample in a study can either come from the distribution for the null hypothesis or the alternative hypothesis. It is assumed to be known throughout the thesis from which hypothesis the distribution of the sample comes from. The reason why this assumption is necessary is in order to investigate the possibility if one could derive the presence of H
0or H
1in a study.
The hypotheses that this thesis uses are the following
H
0:= The sample comes from N (0, 5
2) H
1:= The sample comes from N (1, 5
2)
The studies or in other words, p-values, where analyzed by graphical representations. At first, the distributions of p-values from H
0and H
1were analyzed. After analyzing the p-values, a method for conscious bias was implemented with the purpose of analyzing the p-values further, with respect to conscious bias in a field of research. Finally, the p-values from H
1and H
0were combined with and without conscious bias to produce a more realistic picture of a scientific field.
The second form of bias, unconscious bias, has been analyzed with a method called positive predictive value (PPV). PPV is the probability that the sample comes from H
1given that a significant p-value is present. This thesis considered the proportion of studies with unconscious bias to be known.
The use of these methods among others resulted in graphical representations and tables, that demonstrates an evident difference between the cases when bias is present and when it is not.
The simulations have been compared to results that are based on real studies which confirms the results of this thesis.
One of the conclusions which was drawn is that the presence of conscious bias can be deducted
from the graphical representation of studies in a research field. Furthermore, the PPV is
negatively affected by both forms of bias. Moreover, the amount of studies with significant
p-values increases when bias is present within a research field.
Inneh˚ all
1 Inledning 1
1.1 Syfte . . . . 2
1.2 Problemformulering . . . . 2
1.3 Avgr¨ ansningar . . . . 2
1.4 Etik . . . . 2
2 Bayesiansk referensram f¨ or en studie i simuleringen 3 2.1 Ber¨ akning av p-v¨ arde . . . . 3
2.2 P-v¨ arden som slumpvariabel . . . . 3
2.2.1 F¨ ordelningen av p-v¨ arden under H
1. . . . 4
2.2.2 F¨ ordelning av p-v¨ arden under H
0. . . . 4
2.3 Utfallsrummen och omedveten bias . . . . 4
2.3.1 Utfallstr¨ ad f¨ or en studie . . . . 5
2.4 Positivt prediktivt v¨ arde (PPV) . . . . 6
2.4.1 PPV f¨ or en studie . . . . 6
2.4.2 PPV f¨ or ett forskningsf¨ alt . . . . 6
2.5 Omedveten bias (OB) och dess p˚ averkan p˚ a PPV . . . . 6
2.6 Medveten bias med hj¨ alp av p-hacking . . . . 7
3 Redovisning och analys av simuleringar 8 3.1 Hypotestest och ber¨ akning av p-v¨ arden utan medveten bias . . . . 8
3.1.1 F¨ ordelning av p-v¨ arden utan medveten bias . . . . 8
3.1.2 Visualisering av utfallsrummet och ber¨ akning av PPV med och utan omed- veten bias . . . . 8
3.2 Simulering av medveten bias . . . . 9
3.3 Kombination av p-v¨ ardens f¨ ordelningar . . . . 9
3.4 J¨ amf¨ orelse av simulering med verkliga studier . . . . 10
4 Resultat 10 4.1 Simuleringar av p-v¨ ardenas f¨ ordelningar . . . . 10
4.2 Simuleringar av utfallsrummen med och utan manipulering . . . . 13
4.3 PPV f¨ or forskningsf¨ alt . . . . 14
5 Diskussion 15 5.1 De realiserade utfallsrummen . . . . 15
5.2 F¨ ordelningen av p-v¨ arden . . . . 15
5.3 PPV f¨ or forskningsf¨ alt . . . . 17
5.4 Evaluering av metoderna f¨ or att studera ett forskningsf¨ alt . . . . 18
6 Slutsats och rekommendation f¨ or vidare forskning 18 6.1 Potentiella ˚ atg¨ arder f¨ or att ¨ oka integriteten inom vetenskaplig forskning . . . . 18
6.1.1 Registrera studier p˚ a f¨ orhand . . . . 18
6.1.2 St¨ all krav p˚ a komplett r˚ adata . . . . 19
6.1.3 Avlasta forskare genom att studenter replikerar studier . . . . 19
6.2 Publikationsbias g¨ or att vetenskap inte ¨ ar sj¨ alvkorrigerande . . . . 19
6.3 Rekommendation f¨ or vidare forskning . . . . 19
F¨ orord
Det h¨ ar arbetet ¨ ar ett kandidatprojekt utf¨ ort p˚ a Matematiska vetenskaper vid Chalmers tekniska h¨ ogskola under v˚ aren 2019. Bakom arbetet st˚ ar en grupp av fyra studenter varav tv˚ a personer kommer fr˚ an civilingenj¨ orsprogrammet Maskinteknik vid Chalmers och tv˚ a personer fr˚ an kandi- datprogrammet i matematisk statistik vid G¨ oteborgs universitet.
Varje medlem i gruppen har bidragit till arbetet i dess slutliga form men projektet har delats upp s˚ a att det finns huvudansvariga f¨ or varje del av arbetet. En loggbok har f¨ orts ¨ over var medlems insatser under arbetets g˚ ang.
Vi vill s¨ arskilt tacka v˚ ar handledare professor Serik Sagitov f¨ or v¨ agledning i arbetet och viktiga synpunkter ang˚ aende utformning av arbetet.
Arbetsf¨ ordelningen i form av huvudsakligt ansvar presenteras nedan.
Popul¨ arvetenskaplig presentation: Milton Bark Wikipedia artikel: Milton Bark och Carl Larsson Sammanfattning: Carl Larsson och Lina Hammargren F¨ orord: Lina Hammargren
1: Inledning: Carl Larsson och Lina Hammargren 1.1: Hela gruppen tillsammans
1.4: Hela gruppen tillsammans
2: Bayesiansk referensram f¨ or en studie i simuleringen: Carl Larsson och Lina Hammargren 2.6: Milton bark
3: Redovisning och analys av simuleringar: Milton Bark med bidrag fr˚ an William Nils´ en 4: Resultat: Milton Bark och William Nils´ en
4.3: Carl Larsson och Lina Hammargren med bidrag fr˚ an William Nils´ en 5: Diskussion
5.1: Lina Hammargren 5.2: Milton Bark 5.3: Carl Larsson 5.4: Lina Hammargren 6: Slutsats
6.1: Lina Hammargren 6.2: Milton Bark 6.3: Milton Bark
Viktiga id´ eer och ¨ ovriga bidrag:
Metod f¨ or simulering av fusk: Milton Bark Framtagning av optimal α: Milton Bark
H¨ arledning av PPV f¨ or fallet med och utan omedveten bias: Lina Hammargren
Skapandet av koden: William Nils´ en med bidrag fr˚ an Milton Bark
1 Inledning
Det p˚ ag˚ ar i dagsl¨ aget en diskussion huruvida p-v¨ ardet ska anv¨ andas inom vetenskaplig forskning och p˚ a vilket s¨ att det i s˚ a fall ska anv¨ andas. Exempelvis har tidsskriften Basic and Applied Social Psychology (BASP) f¨ orbjudit anv¨ andandet av p-v¨ arden i de artiklar som de publicerat. Emellertid har debatten nyanserats n˚ agot av exempelvis Olle H¨ aggstr¨ om (2017) som argumenterar f¨ or att p-v¨ ardet kan anv¨ andas i kombination med en diskussion kring resultaten. Ytterligare ett bidrag till debatten gav Christie Aschwanden (2015) som argumenterade f¨ or att ¨ aven effektstorleken som anger hur stor skillnad det ¨ ar mellan de tv˚ a hypoteserna ska diskuteras ut¨ over p-v¨ ardet d˚ a p-v¨ ardet inte visar hur stark en effekt ¨ ar.
Ber¨ akningar av p-v¨ arden ¨ ar en metod f¨ or att ta beslut om hypoteser i forskningsfr˚ agor och anv¨ and- ningen av p-v¨ arden ¨ ar utbredd inom vetenskaplig forskning. Det ¨ ar emellertid en slumpvariabel och risken finns alltid att fel beslut tas om att f¨ orkasta en hypotes baserat p˚ a p-v¨ ardet.
Det kan vara ol¨ ampligt att helt f¨ orbjuda p-v¨ arden d˚ a detta kan vara en bra analysmetod. D¨ aremot kr¨ aver det att studien i ¨ ovrigt ¨ ar v¨ alplanerad i termer av stickprovsstorlek och effektstorlek. Dess- utom kan p-v¨ ardet kompletteras med andra analysmetoder f¨ or att f˚ a en tydligare bild av resultatet.
Det ¨ ar dock inte endast problemet att p-v¨ ardet ¨ ar en slumpvariabel och att signifikanta s˚ av¨ al som icke-signifikanta v¨ arden kan erh˚ allas med metoden oavsett om verklighetstillst˚ andet ¨ ar att den hypotes som studeras ¨ ar sann eller inte som har identifierats inom forskningsv¨ arlden. Inom vissa forskningsomr˚ aden f¨ orekommer det ¨ aven brister i metoden samt utel¨ amnad r˚ adata (Begley och Ellis, 2012). Dessa brister g¨ or att studierna inte kan reproduceras och resultaten av ber¨ akningen av p-v¨ arde blir ¨ an mindre tillf¨ orlitliga.
Reproducerbarhet ¨ ar ett viktigt koncept inom vetenskaplig forskning och inneb¨ ar att en studie skall kunna ˚ aterupprepas och ˚ aterf˚ a samma resultat eller liknande resultat ifall ny data samlas.
I dagsl¨ aget finns det ¨ amnesomr˚ aden och forskningsf¨ alt d¨ ar det f¨ oreligger brist p˚ a reproducerbara studier. Ett exempel p˚ a bristen av reproducerbara studier kartlades i analyser av flera publicerade studier inom bland annat prekliniska cancerstudier d¨ ar bioteknikf¨ oretaget Amgens i ett projekt inte kunde replikera 47 av 53 cancerstudier (ibid). ¨ Amnesomr˚ aden d¨ ar replikationsbristen r˚ ader
¨ ar dock ej begr¨ ansad till medicinsk forskning. Ziliak och McCloskey (2008) granskade 369 artiklar inom ekonomisk forskning, deras resultat visade att endast cirka en av fyra resultat st¨ amde med det som presenterades i artiklarna de studerade.
Det finns flera olika anledningar till varf¨ or problemet har uppkommit. En betydande anledning ¨ ar publiceringsbias, vilket ¨ ar en stark vilja f¨ or forskare att publicera signifikanta resultat. Flera stu- dier har visat p˚ a en tendens att endast statistiskt signifikanta resultat publiceras och att studier som inte ¨ ar signifikanta bortses fr˚ an (H¨ aggstr¨ om, 2016; Rosenthal, 1979). Detta kan t¨ ankas skapa incitament f¨ or forskare, som ofta bed¨ oms utifr˚ an antalet publicerade resultat och dess citeringar av andra forskare, att omedvetet eller medvetet manipulera sin data eller metod f¨ or att ¨ oka san- nolikheten att bli publicerade.
Ovann¨ amnda problem har visat p˚ a behovet av att g¨ ora samlade bed¨ omningar av forskningsf¨ alt och
inte betrakta resultatet p˚ a en enskild studie som fakta. I det h¨ ar projektet kommer tre metoder
f¨ or evaluering av forskningsf¨ alt att presenteras baserat p˚ a erh˚ allna p-v¨ arden. Projektet kan skapa
vidare fr˚ agest¨ allningar kring hur samh¨ allet kvantifierar och v¨ arderar forskning. Hur kan forskares
neutralitet till sin egen forskning kontrolleras och hur stor p˚ averkan har incitamentstrukturen p˚ a
den forskning som produceras? T¨ ors l¨ asaren lita p˚ a alla forskningsresultat och hur viktigt ¨ ar det
att vara kritisk till det mottagaren l¨ aser och anv¨ ander?
1.1 Syfte
Med utg˚ angspunkt i det beskrivna problemet betr¨ affande bristen av reproducerbarhet ¨ ar syftet med rapporten att f¨ orklara f¨ or studenter som kommer komma i kontakt med forskningsresultat i ett tidigt stadie om vad som kan orsaka felaktiga publicerade resultat. Uppsatsen kan t¨ ankas resultera i en mer kritisk student som kan anv¨ anda publicerad forskning mer effektivt i framtida egen forskning och till¨ ampning.
1.2 Problemformulering
M˚ alet ¨ ar att genom en simuleringsstudie av ett fiktivt forskningsf¨ alt kartl¨ agga vilka studier som hade publicerats d˚ a p-v¨ ardet anv¨ ands som beslutsunderlag. Simuleringsstudien best˚ ar av att upp- repa ett frekventistiskt hypotestest f¨ or att ber¨ akna ett p-v¨ arde, s˚ aledes st˚ ar det en simulerad studie bakom varje p-v¨ arde.
Nedan formuleras de evalueringsmetoder som simuleringsstudien kommer unders¨ oka.
• Simulering av p-v¨arde kurvorna inom ett fiktivt forskningsf¨alt, som ¨ar sammanslagningen av studier under H
0och H
1, f¨ or j¨ amf¨ orelse mellan forskningsf¨ alt d¨ ar det f¨ orekommit medveten bias med fallet d¨ ar ingen medveten bias f¨ orekommit.
– P-v¨ ardenas f¨ ordelningar kommer att framst¨ allas grafiskt f¨ or att unders¨ oka f¨ orekomsten av vissa v¨ arden p˚ a p-v¨ ardet under olika omst¨ andigheter.
• En realisation av utfallsrummen i fallen d˚a det f¨orekommer omedveten bias eller medveten bias.
– Utfallsrummet best˚ ar av de olika h¨ andelserna som beskriver vad som leder till att en studie publiceras eller inte.
• Post-studie sannolikheten f¨or att en studie har dragit sitt stickprov fr˚an den alternativa f¨ ordelningen tillh¨ orande alternativhypotesen givet ett signifikant p-v¨ arde
– Denna metod ¨ ar t¨ att sammankopplad med realiseringen av utfallsrummen och g˚ ar direkt att h¨ arleda av de definierade h¨ andelserna.
1.3 Avgr¨ ansningar
• Kandidatarbetet kommer att presentera en f¨orenklad simulering av ett forskningsf¨alt f¨or att besvara fr˚ agest¨ allningen.
• Kandidatarbetet kommer inte att ta fram p-v¨ardens f¨ordelningar fr˚an verkliga studier. D¨ar- emot kommer en j¨ amf¨ orelse g¨ oras med befintliga artiklar som studerar verkliga p-v¨ arde f¨ or- delningar.
• Kandidatarbetet kommer endast att behandla en typ av medveten bias.
• Kandidatarbetet kommer inte ta upp problemet med att studier som borde publiceras inte publiceras.
1.4 Etik
Det finns en risk att resultatet av denna rapport kan medverka till att l¨ asaren f˚ ar sv˚ arare att tro p˚ a studier, forskningsresultat och den vetenskapliga metoden. D¨ arf¨ or ¨ ar det av yttersta vikt att rapporten inte blir anti-vetenskaplig eller uppmuntrar m¨ anniskor till att misstro vetenskap. Detta problem kan tacklas genom att f¨ ora objektiva samt nyanserade resonemang och analyser.
Nyttan med det f¨ orv¨ antade utfallet av rapporten ¨ ar att l¨ asaren blir upplyst och b¨ attre inf¨ orst˚ add kring de problem som idag finns med biased publikationer av forskningsresultat.
Rapporten kommer att unders¨ oka ett strukturellt problem inom forskningsv¨ arlden, och ska inte
anv¨ andas f¨ or att ogiltigf¨ orklara enskilda forskningsresultat och forskares integritet.
2 Bayesiansk referensram f¨ or en studie i simuleringen
F¨ or att kunna bygga upp flera studier i en simulering kr¨ avs en specificering om vad som utg¨ or en studie. I det h¨ ar kapitlet presenteras den matematiska teorin om vad som ligger bakom en studie och dess utfall i simuleringen som redog¨ ors f¨ or i kapitel (3).
Till grund f¨ or ber¨ akning av p-v¨ ardet ligger ett slumpm¨ assigt stickprov som dras fr˚ an den valda populationen. Vi kommer att anta att variansen p˚ a populationen ¨ ar k¨ and. Uttrycket studie kommer i texten att anv¨ andas f¨ or att beskriva detta f¨ orfarande. I simuleringen kommer flera studier att tas fram f¨ or att visualisera p-v¨ ardenas f¨ ordelningar.
2.1 Ber¨ akning av p-v¨ arde
Innan en studie genomf¨ ors finns det en f¨ oreliggande hypotes som ska pr¨ ovas. F¨ or att pr¨ ova hypo- tesen ber¨ aknas p-v¨ ardet f¨ or att unders¨ oka fenomenet inom populationen.
Vi kommer att anta att populationen ¨ ar normalf¨ ordelad i studierna enligt N (µ, σ
2) d¨ ar µ = µ
0eller µ = µ
1och utf¨ ora ett ensidigt hypotestest f¨ or att testa om µ
0< µ
1. Det finns s˚ aledes tv˚ a konkurrerande hypoteser, utfallet av en studie definieras d¨ arav som
H
0:= stickprovet ¨ ar fr˚ an nollf¨ ordelningen N (µ
0, σ
2)
H
1:= stickprovet ¨ ar fr˚ an den alternativa f¨ ordelningen N (µ
1, σ
2)
Vi kommer att dra ett slumpm¨ assigt stickprov av storlek n fr˚ an populationen f¨ or att ber¨ akna p-v¨ ardet. Ett slumpm¨ assigt stickprov (x
1, ..., x
n) ¨ ar en m¨ angd av element som ¨ ar en realisation av (X
1, ..., X
n) d¨ ar X
ii = 1, ..., n ¨ ar slumpvariabler. Realisationen anv¨ ands f¨ or att ber¨ akna det observerade stickprovsmedelv¨ ardet ¯ x =
Pn i=1xi
n
. Det observerade stickprovsmedelv¨ ardet anv¨ ands f¨ or att ber¨ akna teststatistikan z
obssom beskrivs i uttryck (1).
z
obs= x − µ ¯
0√σ n
(1) Teststatistikan anv¨ ands f¨ or att ber¨ akna p-v¨ ardet, vilket ¨ ar sannolikheten att f˚ a ett lika extremt eller mer extremt v¨ arde som den observerade teststatistikan givet att stickprovet dragits ur f¨ ordelningen f¨ or H
0. Komponenterna som anv¨ ands f¨ or att ber¨ akna p-v¨ ardet ¨ ar Φ, Z och z
obsd¨ ar Φ och Z definieras nedan. Vi f˚ ar att p-v¨ ardet blir som i uttryck (2) och betecknas P V .
φ(x) = 1
√ 2π e
−x22och Φ(t) = Z
t−∞
φ(x)dx
Z =
X − µ ¯
0√σ n
, d¨ ar ¯ X = 1 n
n
X
i=1