ÖVNINGSUPPGIFTER KAPITEL 10
För vissa uppgifter behöver du en tabell över den standardiserade normal- fördelningen. Se här.
SAMPLING
1. Nedan ges beskrivningar av fyra sampel. Ange i respektive fall om detta är exempel på ett slumpmässigt draget sampel, ett stratifierat sampel eller ett klustrat sampel. (Notera: I föreläsningsanteckningarna så används benämningen obundet slumpmässigt urval för det som kallas slumpmässigt draget sampel i övningskompendiet.)
a. Vi vill studera om det finns könsskillnader i träningsvanor bland unga föräldrar och samplar först slumpmässigt ett hundratal nyblivna mammor och därefter lika många unga pappor.
b. Hur vanligt är det att finska kvinnor och män blir utsatta för våld i hemmet?
För att svara på denna fråga så skickar vi ut en enkät till 1000 personer som vi slumpmässigt lottat fram från ett register av vuxna finländare. Vi lottar personerna så att alla har samma chans att komma med i samplet.
c. I en studie vill man ta reda på om män med många äldre bröder har en större chans att bli homosexuella. I detta syfte samplar man slumpmässigt ett tusental familjer och samlar in data för varje manligt barn i familjen.
d. Vi vill ta reda på hur arbetslösheten skiljer sig mellan olika områden i Finland och samplar slumpmässigt ett antal personer från respektive kommun.
2. Du vill kartlägga inställningen till droger bland 15-åriga högstadieelever. Ge ett exempel på hur ett klustrat sampel kunde se ut i det här fallet.
3. Nedan visas klipp från en artikel där författarna beskriver två dataset. Dataseten kallas för NCDS och BCS.
Vilket av följande påståenden är sanna?
a. NCDS och BCS är exempel på tvärsnittsdata.
b. NCDS och BCS är exempel på tidsseriedata.
c. NCDS och BCS är exempel på poolade tvärsnitt.
d. NCDS och BCS är exempel på paneldata.
NORMALFÖRDELNINGEN
4. Hur stor blir inflationen nästa år? Anta att inflationstakten är normalfördelad med väntevärdet 2 procent och standardavvikelsen 1 procent. Vilket eller vilka av följande påståenden är sanna (tips: utnyttja 95-100-regeln):
a. Inflationen kommer att ligga någonstans mellan 0 och 4 procent med ~95 procentig sannolikhet.
b. Sannolikheten för att vi får en negativ inflation (dvs. deflation) är ~5 procent.
c. Sannolikheten för att inflationen blir över 5 procent är nära 0.
5. X är en normalfördelad variabel med väntevärde 20 och standardavvikelsen 4.
Beräkna följande sannolikheter:
a. P(X ≥ 20) b. P(X ≤ 14) c. P(X ≥ 14) d. P(X ≥ 31,4)
6. För att bli flygvärdinna i Kina krävs det att man är minst 165 centimeter lång. En genomsnittlig kinesisk kvinna är 160 centimeter med standardavvikelsen 4 centimeter, där längden är normalfördelad. Hur stor procent av kinesiska kvinnor skulle kunna bli flygvärdinnor?
7. I vissa länder har man noterat följande paradox: Männen har i snitt sämre avgångsbetyg från gymnasiet, men ändå en större chans än kvinnorna att bli antagna till de bästa utbildningarna. Hur är det möjligt? Figuren nedan ger svaret. I blått visas fördelningen för männens meritpoäng från gymnasiet och i rött visas fördelningen för kvinnornas. Båda är normalfördelade. Kvinnorna snittar 100 poäng och männen 95; kvinnornas standardavvikelse är 10 poäng och männens 16.
En läkarutbildning antar enbart personer som fått minst 120 meritpoäng i avgångsbetyg. Hur stor är sannolikheten för att en slumpmässigt utvald kvinna skulle bli antagen? En slumpmässigt utvald man?
CENTRALA GRÄNSVÄRDESSATSEN
8. Vi samplar slumpmässigt 400 personer från en population där 50 procent är lever under fattigdomsgränsen (2 dollar per dag). Vilken av figurerna nedan (A, B eller C) representerar samplingfördelningen för 𝑝̂, där 𝑝̂ är andelen personer i samplet som lever under fattigdomsgränsen.
50 60 70 80 90 100 110 120 130 140 150
Män Kvinnor
0 0,25 0,5 0,75
Under fattigdomsgränsen
Över fattigdomsgränsen
Andel
A
9. En genomsnittlig finländare har 10 års utbildning. Du samplar slumpmässigt ett antal finländare och mäter genomsnittligt antal skolår i samplet, 𝑥̅ . Figuren nedan visar två samplingfördelningar, A och B. Den ena visar sampling- fördelningen för 𝑥̅ då n = 500 och den andra då n = 1000. Vilken fördelning, A eller B, beskriver samplingfördelningen för 𝑥̅ då n = 1000? Ingen motivering behövs.
10. Du samplar slumpmässigt 100 stycken 40-åriga kvinnor och mäter genomsnittligt antal barn per kvinna, 𝑥̅. I populationen så har kvinnorna i snitt 2 barn med en standardavvikelse på 1 barn.
a. Beräkna standardavvikelsen för 𝑥̅. (Eller med andra ord: Hur stor är standardavvikelsen i samplingfördelningen för 𝑥̅?)
b. Hur stor är sannolikheten för att få sampel där kvinnorna i snitt har någonting mellan 1,8 och 2,2 barn?
c. Hur stor är sannolikheten för att få ett sampel där kvinnorna i snitt har mindre än 2,3 barn?
0,4 0,45 0,5 0,55 0,6
B.
0,5 0,55 0,6 0,65 0,7
C.
9,4 9,6 9,8 10 10,2 10,4 10,6
A B
11. Du samplar slumpmässigt 10 000 arbetstagare och mäter längden för deras arbetsvecka. I populationen så har arbetstagarna en genomsnittlig arbetsvecka på 34 timmar med en standardavvikelse på 5 timmar.
a. Beräkna standardavvikelsen för 𝑥̅. (Eller med andra ord: Hur stor är standardavvikelsen i samplingfördelningen för 𝑥̅?)
b. Hur stor är sannolikheten för att få sampel där den genomsnittliga arbetsveckan är minst 34,15 timmar lång? (Det vill säga: En överskattning på minst 9 minuter.)
12. Bland finska ungdomar så är det 10 procent som hoppar av gymnasiet. Du samplar slumpmässigt 900 ungdomar och mäter hur stor andel av dessa som hoppade av gymnasiet, 𝑝̂.
a. Beräkna standardavvikelsen för 𝑝̂. (Eller med andra ord: Hur stor är standardavvikelsen i samplingfördelningen för 𝑝̂?)
b. Hur stor är sannolikheten för att få sampel där minst 12 procent av ungdomarna hoppade av gymnasiet?
c. Hur stor är sannolikheten för att få ett sampel där denna andel ligger någonstans mellan 8-12 procent?
d. Anta nu att du inte vet hur stor andel som hoppar av gymnasiet, men att du vet att denna andel var 10 procent för några år sedan. I samplet så är det 13 procent som hoppade av. Är detta en signifikant ökning? Motivera kortfattat.
13. 20 procent av finska pappor stannar hemma med barnet minst 3 månader. Du samplar slumpmässigt 400 finska pappor och mäter hur stor andel av dessa som stannade hemma minst tre månader, 𝑝̂.
a. Beräkna standardavvikelsen för 𝑝̂. (Eller med andra ord: Hur stor är standardavvikelsen i samplingfördelningen för 𝑝̂?)
b. Hur stor är sannolikheten för att få sampel där andelen pappor som stannat hemma minst tre månader ligger någonstans mellan 18-22 procent?
c. Anta nu att vi inte vet hur stor andel av finska pappor som stannar hemma med barnen minst tre månader, men vi vet att denna andel är 20 procent bland svenska pappor. I det finska samplet visar det sig att 18 procent av papporna stannat hemma minst tre månader. Är detta signifikant lägre än svenskarna? Motivera kortfattat.
d. Se uppgift c, men anta nu att 15 procent av papporna i det finska samplet stannat hemma minst tre månader. Är detta signifikant lägre än bland svenskarna? Hur stort är p-värdet?
e. Beräkna också ett ungefärligt 95-procentigt konfidensintervall för p (populationens andel). Anta då att 15 procent av papporna i samplet stannade hemma minst tre månader.