SPSS och Excel kort introduktion till statistikfunktioner

(1)

SPSS och Excel

– kort introduktion till statistikfunktioner

(2)

SPSS och Excel – kort introduktion till statistikfunktioner

Introduktion

Excel är ett kalkylprogram, där man enkelt kan hantera data med sortering, enklare statistiska uppgifter och det är enkelt att göra illustrativa diagram.

SPSS är ett rent statistikprogram, vars företräden ligger i avancerade statistiska beräkningar, men där diagram är lite mer svårkonstruerat.

Bägge har alltså sina fördelar och kan användas omväxlande, beroende på vilken uppgift man ska företa sig.

Data

Data måste matas eller importeras in i programmen. Inmatning kräver att man i förväg vet hur man ska strukturera sina data i kolumner och rader. Inklistring eller import är bara att överföra en etablerad struktur, som ibland kan behöva justeras.

Excel

I Excel är kolumnerna konsekutivt namngivna med versaler av alfabetet, men i första raden i kalkylarket kan ges separat/förklarande namngivning (obegränsat antal och typ av tecken).

Import av data sker under Arkiv – Öppna, där de vanligaste dataformaten kan väljas:

(3)

SPSS

I SPSS är kolumnerna namngivna löpande VAR00001, VAR00002 osv, om man inte i Variable View ändrar namn (max 8 tecken, ej numerisk inledning).

Import av data i SPSS sker genom File – Open - Data, där olika filformat kan väljas.

(4)

Import kan också ske genom File – Open Database - Query, där motsvarande frågor som i Excel får besvaras.

Typer

Data kan ju vara i textformat dvs kategoriska/kvalitativa eller numeriska=kvantitativa. I många fall känner programmet igen om det är kategoriska eller numeriska, men ibland kan det behöva justeras. Justering kan ske i form av angivande av datatyp eller genom transformering, beroende på vilken skaltyp som ska användas.

Nominalskala används för kategoriska data utan ordning (kön, färg etc). I Excel kan det ibland behöva anges som Text. Det görs genom att markera hela kolumnen (klicka på kolumnen högst upp), högerklicka i kolumnen, välja Formatera celler och välja aktuellt format.

(5)

I Excel kan enkla beräkningar göras av nominaldata genom funktionen Infoga – Pivottabell.

(6)

Pivottabellen kan även fås som diagram, genom att markera tabellen och klicka på diagramsymbolen i menyraden.

(7)

I SPSS får kategoriska data anges i Variable View, kolumn Type. Där anges String för textdata.

I SPSS kan frekvensen av kategoriska data fås genom Analyze – Descriptive Statistics – Frequencies:

Frequencies

Statistics

Kön

N Valid 441

Missing 0

(8)

Frequency Percent Valid Percent

Cumulative Percent

Valid Kvi 220 49,9 49,9 49,9

Man 221 50,1 50,1 100,0

Total 441 100,0 100,0

Diagram i SPSS åstadkoms genom att välja Graphs – Legacy dialogs - Pie

(9)

Transformering av data kan ske på olika sätt.

I Excel är det enklast att markera aktuell kolumn och under Start – Sök och markera använda funktionen Sök och ersätt.

(10)

I SPSS kan man använda funktionen Transform – Recode into Different Variables:

(11)

Antal decimaler kan behöva justeras. I Excel sker det som ovan med högerklick av markerad kolumn, välj Formatera celler och välja aktuellt format, där specifikation kan ges.

I SPSS görs motsvarande i Variable View, där antal siffror och decimaler kan anges:

(12)

Numeriska data

I Excel kan en enkel beskrivande statistik tas fram genom att under Data använda Dataanalys (Analysis toolpack måste vara installerat):

I nästa dialogruta måste aktuell kolumn anges, antingen genom att markera i kalkylbladet (C2-C442), eller genom att skriva $C:$C. Markera då att Första raden innehåller etikett (=Namn).

En sammanfattning fås då enligt följande:

(13)

I SPSS väljs funktionen Analyze – Descriptive Statistics – Descriptive:

Under Options kan olika mått väljas

(14)

Descriptive Statistics

N Range Minimum Maximum Sum Mean

Std.

Deviation Variance Skewness Kurtosis

Statistic Statistic Statistic Statistic Statistic Statistic Statistic Statistic Statistic Std.

Error Statistic Std.

Error Kolesterol 441 4,96 3,90 8,86 2630,29 5,9644 ,96097 ,923 ,341 ,116 -,476 ,232 Valid N

(listwise)

441

(15)

Ett enkelt plott-diagram fås i Excel genom att markera aktuell kolumn, under Infoga klicka på diagramsymbolen för punktdiagram:

Diagrammet kan sedan justeras genom att högerklicka på olika delar av diagrammet och definiera enheter etc.

I SPSS väljs funktionen Graphs – Legacy Dialogs - Scatter/Dots och sedan får diagrammet definieras:

(16)

(17)

Om man i SPSS vill förändra diagrammet, får man högerklicka på objektet och välja Edit Content. I separat ruta kan man sedan manipulera objektet.

Histogram går att åstadkomma i Excel, men kräver för att bli snyggt fördefinierade intervall (kallas Fack i dialogrutan).

Under Data – Dataanalys – Histogram preciserar man kolumn/värden och väljer diagramutdata:

(18)

I SPSS är ett histogram för frekvenser lite snabbare att åstadkomma, men mer bundet i utformning.

Under Analyze – Descriptive - Frequencies väljs aktuell variabel, klicka på Charts och ange histogram och även With normal curve. Om man inte vill ha tabell med värden, klickar man bort Display frequency tables.

(19)

(20)

Korstabulering görs i Excel med Infoga – Pivottabell. Då får man ett nytt kalkylblad, där man i högerkolumnen drar och släpper de variabler man markerat.

I den färdiga tabellen, kan sedan olika utfall väljas: antal, summa, medel etc. Det görs genom att i rutan för ∑ Värden i den separata högerkolumnen på nedåtpilen bredvid variablen, välja Värdefältinställningar och där välja vad man vill visa. Samtidig visning av tex medel och SD går ej. Under Alternativ går det att välja visning i bl.a. procent om man väljer fliken Visa värden som.

Tyvärr är det omständigt att i Excel göra statistiska beräkningar på korstabeller, det går, men innefattar flera moment.

I SPSS finns en speciell funktion för korstabeller Analyze – Descriptives – Crosstabs. Här

(21)

Under Statistics väljs om statistisk testning ska göras och i så fall vilken.

Under Cells väljs hur redovisning ska ske, om förväntat ska redovisas i antal och i procent etc.

(22)

Kön * Utbildning Crosstabulation

Count

Utbildning

Total

1,00 2,00 3,00

Kön Kvi 94 96 30 220

Man 106 86 29 221

Total 200 182 59 441

(23)

Test av medelvärden

För att testa medelvärden i Excel, krävs att materialet delas upp, så att tex män är för sig och kvinnor för sig. Det är relativt lätt att göra, men innebär (kanske) onödiga moment.

Sortera materialet under Data – Sortera och ange kön. Klipp ut samtliga värden för män och klistra in från kolumn J, samt namnge de nya kolumnerna.

Under Verktyg – Dataanaly välj t-test: Två sampel antar lika varians

(24)

I SPSS går det snabbare: Analyze – Compare means – Means

Under Options anges vad man vill ha ut

Report Kostelerol

5,9667 220 ,93860

5,9621 221 ,98486

Kön Kvinna Man

Mean N Std. Deviation

(25)

Linjär korrelation – regression

Linjär regression-korrelation kräver numeriska data för analys.

I Excel kan korrelationsvärdet mellan ålder och kolesterolvärde enkelt fås fram i Verktyg – Dataanalys – Korrelation:

En graf kräver separat användning av diagramverktyget, när värdena först sorterats efter ålder.

I dialogrutan för Diagram väljs Linje:

I nästa dialog väljs fliken Serie, Ålder tas bort och x-axeln värden markeras.

(26)

Kolesterol

0,00 1,00 2,00 3,00 4,00 5,00 6,00 7,00 8,00 9,00 10,00

Ålder 46 48 49 50 51 52 52 53 54 55 55 56 56 57 57 58 59 60 60 61 62 62 63 64 64 65 65 66 67 67 69 70 71 72 73 74 76 78 82 86

Som tidigare kan diagrammets utseende förändras genom att markera enskilda element.

En trendlinje kan läggas in för att illustrera korrelationen: Högerklicka på något värde i kurvan, markera Infoga trendlinje och välj linjär:

Diagramrubrik

7,00 8,00 9,00 10,00

(27)

I SPSS beräknas korrelation i Analyze – Correlate – Bivariate

Correlations

Ålder Kostelerol

Ålder Pearson

Correlation 1 ,494(**)

Sig. (2-tailed) ,000

N 441 441

Kostelerol Pearson

Correlation ,494(**) 1

Sig. (2-tailed) ,000

N 441 441

** Correlation is significant at the 0.01 level (2-tailed).

Graf i SPSS görs under Graphs – Linear. Även här måste data sorteras först för att få en snygg graf, det görs under Data – Sort Cases

Välj sedan Simple Line Charts och individuella värden

(28)

Ange variablerna i Define

(29)

Regression i Excel låter sig beräknas i Verktyg – Dataanalys – Regression. Ange beroende (y-axel) och oberoende (x-axel) variabler:

(30)

UTDATASAMMANFATTNING

Regressionsstatistik Multipel-R 0,494453 R-kvadrat 0,244484 Justerad R 0,242763 Standardfe 0,83623 Observatio 441

ANOVA

fg KvS MKv F p-värde för F

Regression 1 99,33959 99,33959 142,0597 1,44E-28 Residual 439 306,9841 0,69928

Totalt 440 406,3237

KoefficienterStandardfel t-kvot p-värde Nedre 95% Övre 95%Nedre 95,0%Övre 95,0%

Konstant 2,798691 0,268571 10,42068 7,21E-23 2,270847 3,326536 2,270847 3,326536 Ålder 0,051262 0,004301 11,91888 1,44E-28 0,042809 0,059715 0,042809 0,059715

Förklaring till värden:

I SPSS görs samma analys under Analyze – Regression – Linear. Beroende och oberoende variabler måste anges

(31)

Model Summary

,494^a ,244 ,243 ,83623 ,244 142,060 1 439 ,000

Model 1

R R Square

Adjusted R Square

Std. Error of the Estimate

R Square

Change F Change df1 df2 Sig. F Change

Change Statistics

Predictors: (Constant), Ålder a.

ANOVA^b

99,340 1 99,340 142,060 ,000^a

306,984 439 ,699

406,324 440

Regression Residual Total Model 1

Sum of

Squares df Mean Square F Sig.

Predictors: (Constant), Ålder a.

Dependent Variable: Kostelerol b.

Coefficients^a

2,799 ,269 10,421 ,000

,051 ,004 ,494 11,919 ,000

(Constant) Ålder Model

1

B Std. Error Unstandardized

Coefficients

Beta Standardized

Coefficients

t Sig.

Dependent Variable: Kostelerol a.