• No results found

ÖVNINGSUPPGIFTER KAPITEL 8

N/A
N/A
Protected

Academic year: 2021

Share "ÖVNINGSUPPGIFTER KAPITEL 8"

Copied!
7
0
0

Loading.... (view fulltext now)

Full text

(1)

ÖVNINGSUPPGIFTER KAPITEL 8

SAMPEL KONTRA POPULATION

1. Nedan beskrivs fyra frågeställningar. Ange om populationen är ändlig eller oändlig i respektive fall. Om ändlig, beskriv också vem eller vad som ingår i populationen.

a. Du vill ta reda på om de kvinnliga anställda på ett visst företag tagit ut mer övertid än männen under det senaste året. För att ta reda på detta samlar du in data för ett urval anställda och deras övertidstimmar.

b. En företagare ska skicka iväg en beställning bestående av 1000 rosor till en kund. Företagaren vill ta reda på hur god kvalitet dessa rosor håller och samplar slumpmässigt ett antal för testning.

c. Du vill ta reda på om den vinnande lottoraden de facto dras slumpmässigt så att alla sifferkombinationer har samma chans att bli dragna. Du samlar in historiska data över vinnande lottorader under de senaste 20 åren.

d. Du vill ta reda på om energidrycker höjer pulsen. Du låter hundra försökspersoner dricka en energidryck och uppmäter något förhöjda pulsvärden.

2. Forskare studerar skallstorleken i ett sampel bestående av 28 vuxna neandertal- kranier. Syftet är att lära sig om väntevärdet för skallstorleken i populationen av alla neandertalare. Den genomsnittliga skallstorleken i samplet uppmättes till 1500 ml.

a. Vad är parametern av intresse i denna studie?

b. Vad är estimatet?

3. Politikerna vill ta reda på hur stor andel av finska kvinnor som ställer sig positiva till surrogatmödraskap. De samplar därför slumpmässigt 500 kvinnor och finner att 185 av dessa är positiva.

a. Vad är parametern av intresse i denna studie?

b. Vad är estimatet?

HYPOTESPRÖVNING

(2)

4. Se spridningsdiagrammen nedan (A, B och C). Alla tre samband har samma korrelation och samma regressionslinje (r = 0,10, b = 0,15). Vi vill testa om sambandet mellan variablerna är signifikant.

a. För vilket sampel (A, B eller C) är t-värdet som störst? För vilket sampel är t- värdet som lägst?

b. Enbart för ett av samplen är sambandet signifikant. Vilket?

5. Spridningsdiagrammet nedan beskriver sambandet mellan sysselsättningsgrad och självmordsfrekvens bland män i 169 länder. Du vill testa om sambandet är signifikant och får ett t-värde på -3,10. Är detta ett signifikant samband?

Motivera kortfattat.

6. Du vill testa om ungdomar med ADHD har ett sämre genomsnittlig arbetsminne än ungdomar överlag. (Arbetsminnet är en persons korttidsminne och kan mätas som antalet siffror en person kan hålla i minnet samtidigt.) Bland ungdomar överlag ligger det genomsnittliga arbetsminnet på 7 siffror: µ = 7.

Bland 50 slumpmässigt utvalda ungdomar med ADHD så är det genomsnittliga arbetsminnet 6,0 siffror.

a. Beskriv noll- och mothypotesen.

b. T-värdet blir -2,2. Betyder detta att ungdomar med ADHD har signifikant sämre arbetsminne än ungdomar överlag? Motivera kortfattat.

0204060

självmord

40 50 60 70 80 90

sysselsättning

(3)

7. I kapitel 5 (Multipel regression) så såg vi på följande regression hämtad ur artikeln Body mass index as indicator of standard of living in developing countries.

Utfallet är BMI.

a. Enbart en av de oberoende variablerna har inte en signifikant effekt på BMI.

Vilken?

b. Water, dummy är en variabel som antar värdet 1 om personen har tillgång till rent vatten och annars värdet 0. De som har tillgång till rent vatten har i snitt 0,443 enheter högre bmi än övriga (kontrollerat för de andra x- variablerna); p-värdet är 0,0074. Vilket eller vilka av följande påståenden är korrekta?

 Den här effekten hör till de 0,74 procent mest extrema som man kan få bara av slumpen.

 Ungefär 0,7 procent av personerna har tillgång till rent vatten.

 Den här effekten är signifikant på 1-procentsnivån.

8. Tabellen nedan är hämtad ur artikeln Rooted in Poverty? Terrorism, Poor Economic Development, and Social Cleavages. Artikelns frågeställning: Vilka faktorer predikterar terrorism? Man använder data för 95 länder och mäter olika egenskaper hos länderna (ekonomiska, demografiska och politiska) och ser hur dessa relaterar till graden av terrorism. Graden av terrorism mäts som antalet terrorattacker under åren 1986-2002, samt antalet döda i terrorattacker under samma period. I tabellen nedan visas resultatet från två multipla regressionsanalyser (en för respektive utfall). Standardfel ges inom parentes;

signifikanta effekter är utmärkta med en stjärna*.

(4)

a) Visa att arbetslöshet (unemployment) inte har en signifikant effekt på antalet döda (casualties) genom att räkna ut t-värdet. Beskriv också hur stort t- värdet borde vara för att effekten ska klassas som signifikant (ett ungefärligt svar räcker).

b) Visa att Etnisk-religiös mångfald (Ethno-religious diversity) har en signifikant effekt på antalet döda (casualties) genom att räkna ut t-värdet. Ungefär hur stort är p-värdet?

c) Se fråga b: Är den här effekten signifikant på 10- 5- eller 1-procentsnivån?

9. Nedan kan du läsa abstraktet till en artikeln The GCP Event Experiment: Design, Analytical Methods, Results. Artikeln beskriver ett högst kontroversiellt experiment. GCP står för ”The Global Consciousness Project”. Projektet går ut på att mäta om mänsklighetens ”globala medvetande” kan påverka utfallet i slumpgeneratorer (dvs. datorer som kastar ur sig siffror slumpmässigt).

Hypotesen är att stora världsnyheter ska synas i slumpsiffrorna, dvs. påverka det slumpmässiga mönstret i data.

(5)

a) Författarna skriver att: ”The cumulative significance across all events favors the hypothesis by more than 4.5 standard deviation.” Notering: Läs som “…

4,5 standardfel”. Är detta, statistiskt sett, ett starkt stöd för deras hypotes?

Motivera kortfattat.

b) Beskriv nollhypotesen i den här studien.

10. Du vill mäta hur stor andel av studerande vid Åbo Akademi som jobbar vid sidan av studierna. Du samplar slumpmässigt 300 studerande varav 25 procent jobbar vid sidan av studierna, med ett standardfel på 2,5 procentenheter. Vilket eller vilka av följande påståenden är korrekta?

a. Standardfelet mäter hur andelen som jobbar vid sidan av studierna skulle variera från sampel till sampel om vi gjorde upprepade dragningar, men alltid 300 studerande.

b. Ju större sampel desto lägre standardfel (allt annat lika).

c. Standardfelet är ett slags mått på osäkerheten i uppskattningen av den sanna andelen studerande som jobbar vid sidan av studierna.

KONFIDENSINTERVALL

11. Nedan visas abstraktet till artikeln Associations with common health symptoms with bullying in primary school children.

a) Se meningen dom är understruken med blått. Vilket eller vilka av följande påståenden är korrekta?

 Av barnen i samplet är det 20,9 till 24,0 procent som säger sig ha blivit mobbade. Vissa barn är osäkra, så procenten varierar beroende på hur man klassar de osäkra fallen.

(6)

 Den sanna andelen mobbade barn ligger någonstans mellan 20,9 och 24,0 procent med 95-procentig säkerhet.

 Om de hade gjort upp ett 99-procentigt konfidensintervall så hade detta varit bredare än det 95-procentiga.

b) Oddset för att sova dåligt är 3,6 gånger högre bland mobbade barn än bland övriga. Understruket i rött ges också ett 95-procentigt konfidensintervall. Ge en tolkning av detta intervall.

12. Tabellen nedan är klippt ur artikeln Stature and Status: Health, Ability and Labor Market Outcomes. Utfallet är loggad lön (den naturliga logaritmen) och x- variabeln av intresse är längd (height, mätt i tum). Standardfel ges inom parentes. Se specifikationen som inte kontrollerar för testresultat i ung ålder eller övriga kontrollvariabler (extended controls). Gör upp ett ungefärligt 95- procentigt konfidensintervall för effekten av längd. Ge också en tolkning av detta konfidensintervall.

(7)

ANTAGANDEN

13. I en studie samplar man slumpmässigt 30 skolor och samlar in data för varje elev i de samplade skolorna. Man mäter därefter sambandet mellan antalet lärare per elev och elevens betyg. I studien har man kört en standard regression (elevens betyg som utfall; antalet lärare per elev som oberoende variabel) och använt de vanliga p-värdena och konfidensintervallen för att analysera resultatet. Ge kritik på denna studie.

References

Related documents

Vilken skala (linjär/loggad) passar bäst för respektive axelc. I den vänstra kolumnen beskrivs sambandet mellan x och y då bägge mäts på den

Då risken för att åka fast ökar med en procent så minskar antalet brott per invånare i snitt med 0,5 procenta. Då risken för att åka fast ökar med en procentenhet så

En forskare har en hypotes om att immunförsvaret kan påverka, inte enbart en persons fysiska hälsa, men också den mentala.. Forskaren samlar in data för ett hundratal personer och

I regressionen nedan är svart en dummy för svarta och övrig en dummy som antar värdet 1 för personer som varken är vita eller svarta och värdet 0 för dem som är vita eller

Tabellen nedan visar denna procent från det första kvartalet 2012 till det tredje kvartalet 2014.. Beräkna ett säsongsutjämnat glidande medelvärde för det tredje kvartalet

Resultatet visas i frekvenstabellen nedan (variabeln bättre antar värdet 1 för personer som ansåg att det var bättre förr och värdet 0 för övriga).. Hur stort är

För att mäta sambandet mellan lycka och religiositet så är det lämpligt att använda Spearmans rangkorrelation istället för Pearsons?. Förklara kortfattat

Figuren nedan visar procenten kvinnor som jobbar på tillfälliga kontrakt mellan första kvartalet år 1997 till tredje kvartalet år 2014.. Vi anpassar nu en rät trendlinje till