4. Empirisk Metod
4.3 Urval
När vi samlar in betavärden som används i samband med att estimera den förväntade avkastningen för de aktier som vi analyserar hämtar vi in dessa värden från ORBIS databas. De bolag som inte har något betavärde i ORBIS har vi kompletterat från Avanza2.
4.3 Urval
Vi har studerat en population som innehåller 6489 aktierekommendationer berörande företag noterade vid den svenska börsen där respektive rekommendation är i linje med de avgränsningar som är nödvändiga. Vi delar upp aktierekommendationerna i köp-‐ och säljrekommendationer där vi har 5121 köprekommendationer respektive 1368 antal säljrekommendationer. Av dessa rekommendationer är 4724 från finansanalytiker och 1765 från ekonomijournalister. Vår population är de samtliga enheter som vi baserar urvalet på (Bryman & Bell, 2003). Totalt sett finns det (troligtvis) fler finansanalytiker och ekonomijournalister som ger ut aktierekommendationer än de som ingår i våra 6489 aktierekommendationer som vi baserar vårt urval på. På grund av ekonomiska skäl samt tidsramen för studien har vi valt att begränsa oss till Privata Affärer och Redeye med anledning av att dessa två tillhandahållit oss med god information som sträcker sig över en tillräckligt lång tidsperiod. Vi vill även notera att insamlad data i sin ursprungliga form uppgick till 10 421 aktierekommendationer (helt utan avgränsningar).
2 https://www.avanza.se/start
Data som är insamlad bestod av felaktigheter i form av ofullständiga rekommendationer där nyckelinformation saknades. Rekommendationer som saknade ett uttryckt råd (köp eller sälj), typ av aktie, analyskälla, kursinformation (senaste kurs) eller datum har tagits bort och har därmed inte haft möjlighet att inkluderas i populationen. Gällande ”typ av aktie” måste aktien vara noterad vid en svensk börs och möjlig för handel hos en svensk marknadsplattform som är tillgänglig för svenska medborgare att handla vid. Analyskällan är upphovsman till aktierekommendationen och ska uppfylla kravet att antingen vara en ekonomijournalist eller en finansanalytiker.
Utifrån den givna populationen kommer vi således göra ett urval vilket kommer ske genom ett klusterurval med obundet sannolikhetsurval i stegen, även benämnt slumpmässigt urval, detta för att minimera eventuella urvalsfel och kunna behålla våra grupperingar (kluster) (Bryman & Bell, 2003). Vi använder oss av en slumpgenerator som återfinns i Microsoft Office Excel (2011 för Macintosh) för att genomföra sannolikhetsurvalet där sannolikheten för att de olika observationerna från populationen blir utvalda är lika och på förhand känd. Ett obundet slumpmässigt urval, där enheter som utgör populationen har samma sannolikhet att komma med i urvalet (Bryman & Bell, 2003), motiveras av sin definition som den mest relevanta urvalstekniken för vår studie. Då vi vill undersöka aktierekommendationers påverkan på avkastningen för aktier finns det faktorer som är viktigt att dessa förblir unbiased. Tidpunkten för aktierekommendationen, vilket företag som rekommendationen gäller, bransch och lista (exempelvis Large Cap) är alla faktorer som bör vara slumpmässiga då vi som författare har möjlighet att påverka urvalet eftersom vi känner till diverse marknadsfluktuationer, nyheter och andra kausala samband som kan göra att vi väljer bort en aktierekommendation. Genom obundet slumpmässigt urval finns därför en ringa sannolikhet för att skevheter, som beror på den mänskliga faktorn, blir aktuella (Bryman & Bell, 2003).
I ett klusterurval görs den första urvalsprocessen av grupper (Bryman & Bell, 2003), det vill säga våra kluster, där dessa i vårt fall utgörs av första-‐ samt andrahandsinformation från Redeyes respektive Privata Affärers databas. Vi kommer att beräkna ett representativt lägsta urval ur vår population och försäkra oss om att båda våra kluster är representerade inför analysen. För att bryta ned vår urvalsmetod på enklaste sätt innebär det först att välja dessa kluster (första-‐ och andrahandsinformation) för att sedan utföra ett sannolikhetsurval i respektive steg (Bryman & Bell, 2003). Fördelen med att använda ett klusterurval tillsammans med sannolikhetsurval innebär att vi koncentrerar vårt urval bättre än om vi endast hade använt sannolikhetsurval (Bryman & Bell, 2003). Vi kommer använda oss av en klusterurvalsmetod som kallas two-‐stage cluster sampling och kan vara lämplig om varje grupp är stor och innehåller många observationer. I denna metod görs istället ett slumpmässigt oberoende urval för varje grupp (Aczel, 2008). Eftersom våra grupper är relativt stora, 6107 aktierekommendationer av karaktären andrahandsinformation samt 382 aktierekommendationer av karaktär förstahandsinformation, anser vi att en two-‐stage cluster sampling lämpar sig bäst. Då antalet aktierekommendationer från våra inhämtningskällor (Redeye och Privata affärer) varierar mycket i storlek är ett oregelbundet slumpmässigt urval uteslutet. Det samma gäller storleksskillnaden på rekommendationer från finansanalytiker och ekonomijournalister samt skillnaden mellan köp och säljrekommendationer, där finansanalytiker och köprekommendationer är de som dominerar i vår population.
För att beräkna ett lägsta representativt urval benämner vi aktierekommendationer som en binär variabel. Det vill säga att köp-‐ och säljrekommendationer hade således kunnat härledas till ettor och nollor, varpå populationens medelvärde blir ett proportionstal och vi kan erhålla populationsvariansen s2 (Dahmström, 2011). P härleds som en väntevärdesriktig skattning av variansen där P=0,5 vilket är ett maximivärde som nås för populationen (Dahmström, 2011). Givet att centrala gränsvärdessatsen gäller kan ett 95 procentigt konfidensintervall skrivas för
P (Dahmström, 2011). För att bestämma storleken på vårt urval (stickprovsstorleken) kan vi anta att vi ska skatta ett medelvärde för populationen genom medelvärdet för urvalet (Dahmström, 2011). Vi kan använda standardavvikelsen s för att uppnå den eftersträvade precisionen i urvalet, det vill säga att hålla acceptansen av en felmarginal låg (Dahmström, 2011). Vi bestämmer ett precisionskrav för vårt urval där en konstant D inte får överskridas. För att slutligen beräkna ett lägsta representativt urval enligt formel 1.9 (Dahmström, 2011) (härledning formel 4.9 se Appendix VII: Urval – Härledning lägsta representativa urval).
𝑛 ≥ 𝑁 ∗ 𝑃(1 − 𝑃) 𝐵! 𝑍! ∗ 𝑁 − 1 + 𝑃(1 − 𝑃) 4.9
Där vår population N är 6107 respektive 382, P på 0,5 som är en binär variabel där vi intar en försiktighetsprincip genom att använda den maximala variansen, B är den felmarginalen (Lantz, 2009) vi väljer att acceptera vilket vi sätter till 5 procent och Z är ett värde som hämtats från en normalfördelningstabell där ett 95-‐procentigt konfidensintervall motsvarar tabellvärdet 1,960. Vi beräknar urvalet till 362 för andrahandsinformation och 192 för förstahandsinformation.
Vi beräknar sannolikheten, urvalsfraktionen, för att respektive enhet i populationen väljs ut genom n gynnsamma utfall av N möjliga varvid n divideras med N och urvalsfraktionen erhålls (Bryman & Bell, 2003). Urvalsfraktionen beräknas enligt formel 4.10 till 8,538 %.
𝑛
𝑁 4.10