SPSS och Excel
– kort introduktion till statistikfunktioner
© A Beckman 2014
SPSS och Excel – kort introduktion till statistikfunktioner
Introduktion
Excel är ett kalkylprogram, där man enkelt kan hantera data med sortering, enklare statistiska uppgifter och det är enkelt att göra illustrativa diagram.
SPSS är ett rent statistikprogram, vars företräden ligger i avancerade statistiska beräkningar, men där diagram är lite mer svårkonstruerat.
Bägge har alltså sina fördelar och kan användas omväxlande, beroende på vilken uppgift man ska företa sig.
Data
Data måste matas eller importeras in i programmen. Inmatning kräver att man i förväg vet hur man ska strukturera sina data i kolumner och rader. Inklistring eller import är bara att överföra en etablerad struktur, som ibland kan behöva justeras.
Excel
I Excel är kolumnerna konsekutivt namngivna med versaler av alfabetet, men i första raden i kalkylarket kan ges separat/förklarande namngivning (obegränsat antal och typ av tecken).
Import av data sker under Arkiv – Öppna, där de vanligaste dataformaten kan väljas:
SPSS
I SPSS är kolumnerna namngivna löpande VAR00001, VAR00002 osv, om man inte i Variable View ändrar namn (max 8 tecken, ej numerisk inledning).
Import av data i SPSS sker genom File – Open - Data, där olika filformat kan väljas.
Import kan också ske genom File – Open Database - Query, där motsvarande frågor som i Excel får besvaras.
Typer
Data kan ju vara i textformat dvs kategoriska/kvalitativa eller numeriska=kvantitativa. I många fall känner programmet igen om det är kategoriska eller numeriska, men ibland kan det behöva justeras. Justering kan ske i form av angivande av datatyp eller genom transformering, beroende på vilken skaltyp som ska användas.
Nominalskala används för kategoriska data utan ordning (kön, färg etc). I Excel kan det ibland behöva anges som Text. Det görs genom att markera hela kolumnen (klicka på kolumnen högst upp), högerklicka i kolumnen, välja Formatera celler och välja aktuellt format.
I Excel kan enkla beräkningar göras av nominaldata genom funktionen Infoga – Pivottabell.
Pivottabellen kan även fås som diagram, genom att markera tabellen och klicka på diagramsymbolen i menyraden.
I SPSS får kategoriska data anges i Variable View, kolumn Type. Där anges String för textdata.
I SPSS kan frekvensen av kategoriska data fås genom Analyze – Descriptive Statistics – Frequencies:
Frequencies
Statistics
Kön
N Valid 441
Missing 0
Frequency Percent Valid Percent
Cumulative Percent
Valid Kvi 220 49,9 49,9 49,9
Man 221 50,1 50,1 100,0
Total 441 100,0 100,0
Diagram i SPSS åstadkoms genom att välja Graphs – Legacy dialogs - Pie
Transformering av data kan ske på olika sätt.
I Excel är det enklast att markera aktuell kolumn och under Start – Sök och markera använda funktionen Sök och ersätt.
I SPSS kan man använda funktionen Transform – Recode into Different Variables:
Antal decimaler kan behöva justeras. I Excel sker det som ovan med högerklick av markerad kolumn, välj Formatera celler och välja aktuellt format, där specifikation kan ges.
I SPSS görs motsvarande i Variable View, där antal siffror och decimaler kan anges:
Numeriska data
I Excel kan en enkel beskrivande statistik tas fram genom att under Data använda Dataanalys (Analysis toolpack måste vara installerat):
I nästa dialogruta måste aktuell kolumn anges, antingen genom att markera i kalkylbladet (C2-C442), eller genom att skriva $C:$C. Markera då att Första raden innehåller etikett (=Namn).
En sammanfattning fås då enligt följande:
I SPSS väljs funktionen Analyze – Descriptive Statistics – Descriptive:
Under Options kan olika mått väljas
Descriptive Statistics
N Range Minimum Maximum Sum Mean
Std.
Deviation Variance Skewness Kurtosis
Statistic Statistic Statistic Statistic Statistic Statistic Statistic Statistic Statistic Std.
Error Statistic Std.
Error Kolesterol 441 4,96 3,90 8,86 2630,29 5,9644 ,96097 ,923 ,341 ,116 -,476 ,232 Valid N
(listwise)
441
Ett enkelt plott-diagram fås i Excel genom att markera aktuell kolumn, under Infoga klicka på diagramsymbolen för punktdiagram:
Diagrammet kan sedan justeras genom att högerklicka på olika delar av diagrammet och definiera enheter etc.
I SPSS väljs funktionen Graphs – Legacy Dialogs - Scatter/Dots och sedan får diagrammet definieras:
Om man i SPSS vill förändra diagrammet, får man högerklicka på objektet och välja Edit Content. I separat ruta kan man sedan manipulera objektet.
Histogram går att åstadkomma i Excel, men kräver för att bli snyggt fördefinierade intervall (kallas Fack i dialogrutan).
Under Data – Dataanalys – Histogram preciserar man kolumn/värden och väljer diagramutdata:
I SPSS är ett histogram för frekvenser lite snabbare att åstadkomma, men mer bundet i utformning.
Under Analyze – Descriptive - Frequencies väljs aktuell variabel, klicka på Charts och ange histogram och även With normal curve. Om man inte vill ha tabell med värden, klickar man bort Display frequency tables.
Korstabulering görs i Excel med Infoga – Pivottabell. Då får man ett nytt kalkylblad, där man i högerkolumnen drar och släpper de variabler man markerat.
I den färdiga tabellen, kan sedan olika utfall väljas: antal, summa, medel etc. Det görs genom att i rutan för ∑ Värden i den separata högerkolumnen på nedåtpilen bredvid variablen, välja Värdefältinställningar och där välja vad man vill visa. Samtidig visning av tex medel och SD går ej. Under Alternativ går det att välja visning i bl.a. procent om man väljer fliken Visa värden som.
Tyvärr är det omständigt att i Excel göra statistiska beräkningar på korstabeller, det går, men innefattar flera moment.
I SPSS finns en speciell funktion för korstabeller Analyze – Descriptives – Crosstabs. Här
Under Statistics väljs om statistisk testning ska göras och i så fall vilken.
Under Cells väljs hur redovisning ska ske, om förväntat ska redovisas i antal och i procent etc.
Kön * Utbildning Crosstabulation
Count
Utbildning
Total
1,00 2,00 3,00
Kön Kvi 94 96 30 220
Man 106 86 29 221
Total 200 182 59 441
Test av medelvärden
För att testa medelvärden i Excel, krävs att materialet delas upp, så att tex män är för sig och kvinnor för sig. Det är relativt lätt att göra, men innebär (kanske) onödiga moment.
Sortera materialet under Data – Sortera och ange kön. Klipp ut samtliga värden för män och klistra in från kolumn J, samt namnge de nya kolumnerna.
Under Verktyg – Dataanaly välj t-test: Två sampel antar lika varians
I SPSS går det snabbare: Analyze – Compare means – Means
Under Options anges vad man vill ha ut
Report Kostelerol
5,9667 220 ,93860
5,9621 221 ,98486
Kön Kvinna Man
Mean N Std. Deviation
Linjär korrelation – regression
Linjär regression-korrelation kräver numeriska data för analys.
I Excel kan korrelationsvärdet mellan ålder och kolesterolvärde enkelt fås fram i Verktyg – Dataanalys – Korrelation:
En graf kräver separat användning av diagramverktyget, när värdena först sorterats efter ålder.
I dialogrutan för Diagram väljs Linje:
I nästa dialog väljs fliken Serie, Ålder tas bort och x-axeln värden markeras.
Kolesterol
0,00 1,00 2,00 3,00 4,00 5,00 6,00 7,00 8,00 9,00 10,00
Ålder 46 48 49 50 51 52 52 53 54 55 55 56 56 57 57 58 59 60 60 61 62 62 63 64 64 65 65 66 67 67 69 70 71 72 73 74 76 78 82 86
Som tidigare kan diagrammets utseende förändras genom att markera enskilda element.
En trendlinje kan läggas in för att illustrera korrelationen: Högerklicka på något värde i kurvan, markera Infoga trendlinje och välj linjär:
Diagramrubrik
7,00 8,00 9,00 10,00
I SPSS beräknas korrelation i Analyze – Correlate – Bivariate
Correlations
Ålder Kostelerol
Ålder Pearson
Correlation 1 ,494(**)
Sig. (2-tailed) ,000
N 441 441
Kostelerol Pearson
Correlation ,494(**) 1
Sig. (2-tailed) ,000
N 441 441
** Correlation is significant at the 0.01 level (2-tailed).
Graf i SPSS görs under Graphs – Linear. Även här måste data sorteras först för att få en snygg graf, det görs under Data – Sort Cases
Välj sedan Simple Line Charts och individuella värden
Ange variablerna i Define
Regression i Excel låter sig beräknas i Verktyg – Dataanalys – Regression. Ange beroende (y-axel) och oberoende (x-axel) variabler:
UTDATASAMMANFATTNING
Regressionsstatistik Multipel-R 0,494453 R-kvadrat 0,244484 Justerad R 0,242763 Standardfe 0,83623 Observatio 441
ANOVA
fg KvS MKv F p-värde för F
Regression 1 99,33959 99,33959 142,0597 1,44E-28 Residual 439 306,9841 0,69928
Totalt 440 406,3237
KoefficienterStandardfel t-kvot p-värde Nedre 95% Övre 95%Nedre 95,0%Övre 95,0%
Konstant 2,798691 0,268571 10,42068 7,21E-23 2,270847 3,326536 2,270847 3,326536 Ålder 0,051262 0,004301 11,91888 1,44E-28 0,042809 0,059715 0,042809 0,059715
Förklaring till värden:
I SPSS görs samma analys under Analyze – Regression – Linear. Beroende och oberoende variabler måste anges
Model Summary
,494a ,244 ,243 ,83623 ,244 142,060 1 439 ,000
Model 1
R R Square
Adjusted R Square
Std. Error of the Estimate
R Square
Change F Change df1 df2 Sig. F Change
Change Statistics
Predictors: (Constant), Ålder a.
ANOVAb
99,340 1 99,340 142,060 ,000a
306,984 439 ,699
406,324 440
Regression Residual Total Model 1
Sum of
Squares df Mean Square F Sig.
Predictors: (Constant), Ålder a.
Dependent Variable: Kostelerol b.
Coefficientsa
2,799 ,269 10,421 ,000
,051 ,004 ,494 11,919 ,000
(Constant) Ålder Model
1
B Std. Error Unstandardized
Coefficients
Beta Standardized
Coefficients
t Sig.
Dependent Variable: Kostelerol a.