ÖVNINGSUPPGIFTER KAPITEL 10
För vissa uppgifter behöver du en tabell över den standardiserade normal- fördelningen. Se här.
SAMPLING
1. Nedan ges beskrivningar av fyra sampel. Ange i respektive fall om detta är exempel på ett slumpmässigt draget sampel, ett stratifierat sampel eller ett klustrat sampel.
a. Vi vill kartlägga trivseln bland studerande vid Åbo Akademi. I detta syfte samplas 400 studerande. Först samplas 100 stycken gulisar, därefter 100 stycken andra årets studerande, 100 stycken tredje årets studerande samt 100 stycken äldre studerande.
b. Vi vill ta reda på hur arbetslösheten skiljer sig mellan olika områden i Finland och samplar slumpmässigt ett antal personer från respektive kommun.
c. Hur vanligt är det att finska kvinnor och män blir utsatta för våld i hemmet?
För att svara på denna fråga så skickar vi ut en enkät till 1000 personer som vi slumpmässigt lottat från ett register av vuxna finländare. Vi lottar personerna så att alla individer ur populationen har samma chans att bli dragna vid varje dragning.
d. I en studie vill man undersöka om det äldsta barnet tenderar att tjäna mer än yngre syskon. I detta syfte samplar man ett hundratal familjer och samlar in lönedata för varje person.
2. Du vill kartlägga inställningen till droger bland 15-åriga högstadieelever. Ge ett exempel på hur ett klustrat sampel kunde se ut i det här fallet.
3. Nedan visas klipp från en artikel där författarna beskriver två dataset. Dataseten kallas för NCDS och BCS.
Vilket av följande påståenden är sanna?
a. NCDS och BCS är exempel på tvärsnittsdata.
b. NCDS och BCS är exempel på tidsseriedata.
c. NCDS och BCS är exempel på poolade tvärsnitt.
d. NCDS och BCS är exempel på paneldata.
NORMALFÖRDELNINGEN
4. Hur stor blir inflationen nästa år? Anta att inflationstakten är normalfördelad med väntevärdet 2 procent och standardavvikelsen 1 procent. Vilket eller vilka av följande påståenden är sanna (tips: utnyttja 95-100-regeln):
a. Inflationen kommer att ligga någonstans mellan 0 och 4 procent med ~95 procentig sannolikhet.
b. Sannolikheten för att vi får en negativ inflation (dvs. deflation) är ~5 procent.
c. Sannolikheten för att inflationen blir över 5 procent är nära 0.
5. X är en normalfördelad variabel med väntevärde 20 och standardavvikelsen 4.
Beräkna följande sannolikheter:
a. P(X ≥ 20) b. P(X ≤ 14) c. P(X ≥ 14) d. P(X ≥ 31,4)
6. För att bli flygvärdinna i Kina krävs det att man är minst 165 centimeter lång. En genomsnittlig kinesisk kvinna är 160 centimeter med standardavvikelsen 4 centimeter, där längden är normalfördelad. Hur stor procent av kinesiska kvinnor skulle kunna bli flygvärdinnor?
7. I vissa länder har man noterat följande paradox: Männen har i snitt sämre avgångsbetyg från gymnasiet, men ändå en större chans än kvinnorna att bli antagna till de bästa utbildningarna. Hur är det möjligt? Figuren nedan ger svaret. I blått visas fördelningen för männens meritpoäng från gymnasiet och i rött visas fördelningen för kvinnornas. Båda är normalfördelade. Kvinnorna snittar 100 poäng och männen 95; kvinnornas standardavvikelse är 10 poäng och männens 16.
En läkarutbildning antar enbart personer som fått minst 120 meritpoäng i avgångsbetyg. Hur stor är sannolikheten för att en slumpmässigt utvald kvinna skulle bli antagen? En slumpmässigt utvald man?
CENTRALA GRÄNSVÄRDESSATSEN
8. Vi samplar slumpmässigt 400 personer från en population där 50 procent är lever under fattigdomsgränsen (2 dollar per dag). Vilken av figurerna nedan (A, B eller C) representerar samplingfördelningen för 𝑝̂, där 𝑝̂ är andelen personer i samplet som lever under fattigdomsgränsen.
50 60 70 80 90 100 110 120 130 140 150
Män Kvinnor
0 0.25 0.5 0.75
Under fattigdomsgränsen
Över fattigdomsgränsen
Andel
A
9. En genomsnittlig finländare har 10 års utbildning. Du samplar slumpmässigt ett antal finländare och mäter genomsnittligt antal skolår i samplet, 𝑥̅ . Figuren nedan visar två samplingfördelningar, A och B. Den ena visar sampling- fördelningen för 𝑥̅ då n = 500 och den andra då n = 1000. Vilken fördelning, A eller B, beskriver samplingfördelningen för 𝑥̅ då n = 1000? Ingen motivering behövs.
10. Du samplar slumpmässigt 100 stycken 40-åriga kvinnor och mäter genomsnittligt antal barn per kvinna, 𝑥̅. I populationen så har kvinnorna i snitt 2 barn med en standardavvikelse på 1 barn.
a. Beräkna standardavvikelsen för 𝑥̅. (Eller med andra ord: Hur stor är standardavvikelsen i samplingfördelningen för 𝑥̅?)
b. Hur stor är sannolikheten för att få sampel där kvinnorna i snitt har någonting mellan 1,8 och 2,2 barn?
c. Hur stor är sannolikheten för att få ett sampel där kvinnorna i snitt har mindre än 2,3 barn?
0.4 0.45 0.5 0.55 0.6
B.
0.5 0.55 0.6 0.65 0.7
C.
9.4 9.6 9.8 10 10.2 10.4 10.6
A B
11. Du samplar slumpmässigt 10 000 arbetstagare och mäter längden för deras arbetsvecka. I populationen har arbetstagarna en genomsnittlig arbetsvecka på 34 timmar med en standardavvikelse på 5 timmar. Hur stor är sannolikheten för att få sampel där den genomsnittliga arbetsveckan är minst 34,15 timmar lång?
(Det vill säga: En överskattning på minst 9 minuter.)
12. Bland finska ungdomar så är det 10 procent som hoppar av gymnasiet. Du samplar slumpmässigt 900 ungdomar och mäter hur stor andel av dessa som hoppade av gymnasiet, 𝑝̂.
a. Beräkna standardavvikelsen för 𝑝̂. (Eller med andra ord: Hur stor är standardavvikelsen i samplingfördelningen för 𝑝̂?)
b. Hur stor är sannolikheten för att få sampel där minst 12 procent av ungdomarna hoppade av gymnasiet?
c. Hur stor är sannolikheten för att få ett sampel där denna andel ligger någonstans mellan 8-12 procent?
KOPPLINGEN TILL HYPOTESPRÖVNING
13. En intresseorganisation påstår att 90 procent av rökare börjar före de fyller 18.
Men stämmer det? Du samplar slumpmässigt 500 rökare varav 425 började röka före de fyllde 18. Det är alltså något färre än 90 procent, men är skillnaden tillräckligt stor för att vara signifikant? Ange också p-värdet i ditt svar.
14. Är sannolikheten för att aktiekursen rör sig uppåt större än sannolikheten att den rör sig neråt? Tidsseriediagrammet nedan visar Dow Jones index dagligen under de senaste tre åren. Under 529 av 999 handelsdagar så har aktiekursen stigit; under 470 dagar har den sjunkit. Vi ser alltså att aktiekursen stigit i cirka 53 procent av fallen. Men är detta signifikant mer än 50 procent?
Notering: Det här är ett tidsseriedata, och tidsseriedata kan sällan betraktas som slumpmässiga sampel eftersom vi gör beroende mätningar över tid (korrelationen mellan indexet en dag och indexet föregående dag är 0,97). Så kan vi då använda de ”vanliga” formlerna för att analysera detta datamaterial?
Jo, det kan vi. Här tittar vi nämligen på förändringar i aktiekursen, och förändringarna är oberoende (korrelationen mellan förändringen en dag och förändringen föregående dag är -0,04).