• No results found

5.1 Val av metod och datainsamling

Målet med denna studie är att med hjälp av olika faktorer kontrollera om det finns skillnader som påverkar bostadslånetagare i deras val av bindningstid samt undersöka om det skett beteendeförändringar i bolånetagare val med hänsyn till de den osäkerhet Covid-19 gett upphov till.

För att avgöra hur olika faktorer påverkar en beroende variabel som har värden med två kategoriska utfall används oftast en binär logistisk regression. Den logistiska kurvan passar bättre till denna typ av beroende variabler jämfört med en linjär regression eftersom den logistiska kurvan ger en sannolikhet mellan 0 och 1 medan en linjär regression kan anta värden över 1 och under 0. Den ger också tydliga indikationer på om en variabel ger en ökad eller en minskad sannolikhet att en händelse inträffar jämfört mot referenskategorin (Garson 2014).

Dessa värden kan representera en sann dikotomi som exempelvis kan vara död eller levande eller en tvungen dikotomi som kan dela upp längd i lång eller kort. I denna studie kollar vi efter faktorer som påverkar bolånetagarnas val av bolåneräntor och antar att det finns tre val av bindningstider för bolånetagare, fast, rörlig eller en mix av fast och rörlig bindningstid. Därför används en multinomial logistisk regressionsanalys som är en utökning av den binomiala logistiska regressionen i form av att den kan ta hänsyn till två eller fler beroende variabler.

5.2 Logistisk regression

Syftet med metoden som används i denna studie är att genom sannolikheter förstå skillnader mellan olika grupper och deras val av räntebindningstider, för att göra detta används som tidigare nämnt en multinomial logistisk regressionsanalys.

Jag använder mig i detta kapitel av Gujarati & Porter (2009) och Gerson (2014). För att förklara den logistiska modellen görs först den linjära regressionsmodellen om till en linjär sannolikhetsmodell.

𝑌𝑖 = 𝛽0+ 𝛽1𝑋𝑖 + 𝑢𝑖

Där 𝑌𝑖 är den beroende variabeln, 𝑋𝑖 är den oberoende variabeln och 𝑢𝑖 är felvariabeln.

Eftersom utfallsvariabeln, 𝑌𝑖, är binär och endast kan anta två värden, 1 eller 0, kommer regressionen i stället ge sannolikheten att händelsen inträffar (1) i förhållande till att den inte inträffar (0). I den linjära sannolikhetmodellen antas E(𝑢𝑖) = 0, detta ger:

𝐸(𝑌𝑖|𝑋𝑖) = 𝛽0+ 𝛽1𝑋𝑖

Ekvationen förenklas genom att sätta 𝜋𝑖 som sannolikheten att händelsen inträffar (𝑌𝑖 = 1), vilket i sin tur innebär att (1 − 𝜋𝑖) är sannolikheten att händelsen inte inträffar (𝑌𝑖 = 0).

Vilket ger oss 𝜋𝑖 = 𝐸(𝑌𝑖 = 1|𝑋𝑖), vidare innebär detta att den linjära sannolikhetsmodellen kan skrivas som:

𝜋𝑖 = 𝛽0+ 𝛽1𝑋𝑖

Där (𝜋𝑖) = sannolikheten för att 𝑌𝑖 = 1

Eftersom detta är en linjär modell och sannolikheten (𝜋𝑖) ökar linjärt med den oberoende variabeln (𝑋𝑖) kommer sannolikheten till slut överskrida 100% när (𝑋𝑖) → ∞. Dessutom är inte relationen mellan (𝜋𝑖) och (𝑋𝑖) linjära när den beroende variabeln är binär. Detta har fått kritik och i stället används oftast logistiska regressionsmodeller för att predicera binära beroende variabler. Den logistiska regressionsmodellen beskriver, i stället för sannolikheten, oddset för att händelsen inträffar, 𝑌𝑖 = 1. Ett odds bildas av sannolikheten att en händelse inträffar dividerat med sannolikheten att den inte inträffar och kan skrivas så här:

𝜋𝑖 = 𝑒( 𝛽0+𝛽1𝑋𝑖) 1 + 𝑒( 𝛽0+𝛽1𝑋𝑖)

Genom att göra om ( 𝛽1+ 𝛽2𝑋𝑖) till 𝑍𝑖 kan vi förenkla modellen till:

𝜋𝑖 = 𝑒𝑍𝑖 1 + 𝑒𝑍𝑖

Denna modell kallas den logistiska distributionsfunktionen. I detta stadie är 𝜋𝑖, icke linjär i förhållande till 𝛽𝑖 och 𝑋𝑖. Detta korrigeras genom att först byta ut sannolikheten att utfallet inträffar, 𝜋𝑖, till sannolikheten att utfallet inte inträffar 1 − 𝜋𝑖.

1 − 𝜋𝑖 = 1 1 + 𝑒𝑍𝑖

För att ta fram oddskvoten (Odds ratio) som är förhållandet mellan oddsen skrivs ekvationen om:

𝜋𝑖

1 − 𝜋𝑖 = 1 + 𝑒𝑍𝑖

1 + 𝑒−𝑍𝑖 = 𝑒𝑍𝑖

𝑂𝑑𝑑𝑠𝑘𝑣𝑜𝑡𝑒𝑛 = 𝜋𝑖

1 − 𝜋𝑖 = 𝑒𝑍𝑖

Oddskvoten (odds ratio) är alltså ett förhållande som räknas ut genom att oddset för att en händelse ska inträffa divideras med oddset för att händelsen inte ska inträffa. Oddsförhållandet är alltid ett positivt tal där 1,0 har ett förhållande 1:1 med referensvariabeln och den beroende variabeln, ett oddsförhållande på 1,0 har alltså inte någon annorlunda effekt på den beroende variabeln jämfört med referensvariabeln. Ett värde större än 1,0 innebär att sannolikheten att en händelse ska inträffa är större än att den inte ska inträffa och ett värde som är mindre än 1,0 betyder att sannolikheten att en händelse ska inträffa är lägre än att den ska inträffa. Desto längre ifrån 1,0 oddskvoten är desto större är effekten, detta gäller båda riktningar. Det är oddskvoten som oftast används för att tolka den logistiska regressionsmodellen. Men det finns ytterligare ett mått som är intressant vilket ges av att ta den naturliga logaritmen av ekvationen för oddsen och kallas för logiten:

𝐿𝑜𝑔𝑖𝑡𝑒𝑛 = ln ( 𝜋𝑖

1 − 𝜋𝑖 ) = 𝑍𝑖 → (𝛽0+ 𝛽1𝑋𝑖)

Det går där med att definiera logiten som den naturliga logaritmen för sannolikheten att en händelse inträffar dividerat med sannolikheten för att den inte inträffar, den är både är linjär i 𝑋𝑖 och i parametrarna och blir således det förväntade värdet av den beroende variabeln. Detta innebär att 𝛽𝑖 är en logitkoefficient i den logistiska regressionsmodellen.

5.3 Multinomial logistisk regression

Den multinomiala logistiska regressionen kan ta hänsyn till fler än två utfall av den beroende variabeln. Modellen fungerar som den logistiska regressionen med undantaget att ett av utfallen bildar en referenskategori och de andra utfallen beräknas i förhållande till referenskategorin.

Det är att föredra att sätta det utfallet som är vanligast som referenskategori dock går alla kategorier går att använda som referenskategori. Den multinomiala logistiska regressionen uttrycker oddskvoten på samma sätt som den logistiska regressionen med undantaget att den beroende variabeln uttrycks med (i – 1) där i är antalet kategorier i den beroende variabeln och 1 subtraheras för referensvärdet. Logiten följer samma mönster och nämnaren antar alltid samma värde (referenskategorin) medan täljaren byts ut beroende på vilken kategori av den beroende variabeln som mäta.

Referenskategorin i regressionen är rörlig ränta vilket innebär att logiten och oddskvoten för mix och bunden ränta, som presenteras i kapitel 7, är jämförda mot rörlig ränta. Ekvationerna ställs upp enligt följande:

Ekvation 1

𝐿𝑜𝑔𝑖𝑡𝑒𝑛(𝐵𝑢𝑛𝑑𝑒𝑛) = ln (𝜋(𝐵𝑢𝑛𝑑𝑒𝑛 𝑟ä𝑛𝑡𝑎)

𝜋(𝑅ö𝑟𝑙𝑖𝑔 𝑟ä𝑛𝑡𝑎) ) = 𝛽0+ 𝛽1𝑋1+ 𝛽2𝐷2+ 𝛽3𝐷3 + 𝛽4𝐷4+ 𝛽5𝐷5+ 𝛽6𝐷6+ 𝛽7𝐷7+ 𝛽8𝐷8+ 𝛽9𝐷9+ 𝛽10𝐷10+ 𝛽11𝐷11+ 𝛽12𝐷12+ 𝛽13𝐷13+ 𝛽14𝐷14+ 𝛽15𝐷15+ 𝛽16𝐷16+ 𝛽17𝐷17+ 𝛽18𝐷18+ 𝛽19𝐷19+ 𝛽20𝐷20+ 𝛽21𝐷21+ 𝛽22𝐷22+ 𝛽23𝐷23+ 𝛽24𝐷24+ 𝛽25𝐷25+ 𝛽26𝐷26+ 𝛽27𝐷27+ 𝛽28𝐷28+ 𝛽29𝐷29+ 𝛽30𝐷30

Ekvation 2

𝐿𝑜𝑔𝑖𝑡𝑒𝑛(𝑀𝑖𝑥) = ln (𝜋(𝑀𝑖𝑥 𝑎𝑣 𝑟ä𝑛𝑡𝑎)

𝜋(𝑅ö𝑟𝑙𝑖𝑔 𝑟ä𝑛𝑡𝑎) ) = 𝛽0+ 𝛽1𝑋1+ 𝛽2𝐷2+ 𝛽3𝐷3+ 𝛽4𝐷4 + 𝛽5𝐷5 + 𝛽6𝐷6+ 𝛽7𝐷7+ 𝛽8𝐷8+ 𝛽9𝐷9+ 𝛽10𝐷10+ 𝛽11𝐷11+ 𝛽12𝐷12+ 𝛽13𝐷13+ 𝛽14𝐷14+ 𝛽15𝐷15+ 𝛽16𝐷16+ 𝛽17𝐷17+ 𝛽18𝐷18+ 𝛽19𝐷19+ 𝛽20𝐷20+ 𝛽21𝐷21+ 𝛽22𝐷22+ 𝛽23𝐷23+ 𝛽24𝐷24+ 𝛽25𝐷25+ 𝛽26𝐷26+ 𝛽27𝐷27+ 𝛽28𝐷28+ 𝛽29𝐷29+ 𝛽30𝐷30

X1 = Räntedifferens

Variabler till ekvation 1 och 2

5.4 Validitet

Begreppet validitet betyder giltighet och utgör tillsammans med reliabiliteten den tillförlitlighet som studien uppfyller. Validitet handlar om att undersöka det som studiens problemformulering syftar att undersöka och dess relevans. I denna kvantitativa datainsamling stärks validiteten genom att se till korrelationen mellan de undersökta variablerna (Eliasson, 2018). Trotts begränsad tid att arbeta med det insamlade datamaterialet har statistikprogrammet SPSS gjort det möjligt att använda en större mängd data som avser 152 295 unika händelser.

Då det insamlade datamaterialet avser nutida rådata från en av Sveriges största banker utgör innehåller ett exklusivt material som talar för en större population. Primärdata är inhämtat från en databas som sedan bearbetats i SPSS vilket bidrar till att trovärdigheten kan klassas som stark då insamlingen noga har preciserats.

Related documents