Biostatistics Workshop
2018-02-05
BIMK90
Hypotesprövning
[UPPGIFT]
Statistiska begrepp
Vad betyder egentligen följande statistiska begrepp?
Hur vissa av begreppen ihop?
Population
Beroende variabel Oberoende variabel
Standardavvikelse
Konfidensintervall
Medelvärde
Spridningsmått
Median
Percentil
Normalfördelning
Förväxlingsfaktorer
Parametriskt test Icke-parametriskt test
Diskret variabel Kategorisk variabel
Kontinuerlig variabel Parat test
Skewness
Kurtosis
Outlier Histogram
Transformation Student’s t test
Mann-Whitney
ANOVA Kruskal-Wallis
Effektstorlek
Standard error of the mean
Vad ska man ha biostatistik till?
[UPPGIFT]
Är det en statistiskt signifikant skillnad?
Mätvärden
Beskrivande statistik
Figur/graf/plot Hur ska man gå till väga?
Vad finns det för möjliga problem?
C o n t r o l K n o c k d o w n
0 5 1 0 1 5 2 0
Cellcounts
Number of values Minimum
25% Percentile Median
75% Percentile Maximum Mean
Std. Deviation Std. Error of Mean Lower 95% CI of mean Upper 95% CI of mean Skewness
Kurtosis
Control 6 10.2 11.18 12.6 16.4 17.6 13.42 2.815 1.149 10.46 16.37 0.6572 -0.9786
Knock down 6
6.4 7.075 7.85 9.825 13.5 8.583 2.521 1.029 5.937 11.23 1.97 4.328
Control Knock down
10.2 7.3
12.4 8.6
16.0 13.5
17.6 6.4
11.5 8.1
12.8 7.6
C o n t r o l T r e a t m e n t X 0
2 4 6 8 1 0
Measured output
Unpaired t test
P value 0.0366 Mann Whitney test
P value 0.1000
Vad påverkar p-värdet i t test och Mann-
Whitney test?
C o n t r o l T r e a t m e n t X 0
2 4 6 8 1 0
Measured output
Unpaired t test
P value 0.0688 Mann Whitney test
P value 0.1000
Ökad standardavvikelse
C o n t r o l T r e a t m e n t X 0
2 4 6 8 1 0
Measured output
Unpaired t test
P value 0.0088 Mann Whitney test
P value 0.1000
Ökad effektstorlek
C o n t r o l T r e a t m e n t X 0
2 4 6 8 1 0
Measured output
Unpaired t test
P value 0.0172 Mann Whitney test
P value 0.0286
Fler replikat
C o n t r o l T r e a t m e n t X 0
2 4 6 8 1 0
Measured output
Unpaired t test
P value 0.0138 Mann Whitney test
P value 0.0357
Fler replikat
Blodgivare 1 Blodgivare 2
Kontroll Testsubstans
Blodgivare 3 Blodgivare 4 Blodgivare 5
[UPPGIFT]
Hur skulle du testa om det finns en statistiskt skillnad i cytokinfrisättning från blodceller behandlade med en testsubstans jämfört med en kontrollbehandling?
Vad finns det för möjliga problem?
Finns det flera olika sätt att analysera detta
statistiskt?
Sätt att redovisa data – två eller flera grupper
Tabell Control
(n=15)
Treatment X
(n=11) p-value Measured output,
mean ± standard deviation 93 ± 23 65 ± 28 0.0051
*Measured output,
median (inter-quartile range) 97 (77-111) 63 (38-92) 0.013
#*= t test
#= Mann-Whitney test
C o n t r o l T r e a t m e n t X 0
5 0 0 0 0 1 0 0 0 0 0 1 5 0 0 0 0 2 0 0 0 0 0
Measured output
Scatter plot
C o n t r o l T r e a t m e n t X 0
5 0 0 0 0 1 0 0 0 0 0 1 5 0 0 0 0
Measured output
Bar graph
(medel±std.av.)
C o n t r o l T r e a t m e n t X 0
5 0 0 0 0 1 0 0 0 0 0 1 5 0 0 0 0
Measured output
Medelvärdesplot
(medel±95%konfidensintervall)
C o n t r o l T r e a t m e n t X 0
5 0 0 0 0 1 0 0 0 0 0 1 5 0 0 0 0 2 0 0 0 0 0
Measured output
Box plot
C o n t r o l T r e a t m e n t X 0
5 0 0 0 0 1 0 0 0 0 0 1 5 0 0 0 0 2 0 0 0 0 0
Measured output
Scatter/bar graph
Sätt att redovisa data – tidsserie/dosrespons
0 2 4 6 8
0 5 1 0 1 5 2 0
H o u r s
Measured output
A B C
0 2 4 6 8
0 5 1 0 1 5 2 0
H o u r s
Measured output
A B C
0 2 4 6 8
0 5 1 0 1 5 2 0
H o u r s
Measured output
A B C
0 2 4 6 8
0 5 1 0 1 5 2 0
H o u r s
Measured output
A B C
0 2 4 6 8
0 5 1 0 1 5 2 0
H o u r s
Measured output
A B C
0 2 4 6 8
0 5 1 0 1 5 2 0
H o u r s
Measured output
A B C
C o n t r o l T r e a t m e n t X 0
5 0 0 0 0 1 0 0 0 0 0 1 5 0 0 0 0
Measured output
Sätt att redovisa data – parade data
0 2 4 6 8
0 5 1 0 1 5 2 0
H o u r s
Measured output
A B C
Två grupper Tidsserie/flera grupper
4 5 6 7 8 2 5
3 0 3 5 4 0 4 5 5 0
V a r ia b le X
Variable Y
Sätt att redovisa data – korrelationer
4 5 6 7 8
2 5 3 0 3 5 4 0 4 5 5 0
V a r ia b le X
Variable Y
Använd färg och form för fler variabler
Vilket försök litar ni mest på: A, B eller C?
A B C
C o n t r o l T r e a t m e n t X 0
1 0 0 0 0 0 2 0 0 0 0 0 3 0 0 0 0 0
Measured output
p = 0 . 0 7 5
C o n t r o l T r e a t m e n t X 0
5 0 0 0 0 1 0 0 0 0 0 1 5 0 0 0 0 2 0 0 0 0 0 2 5 0 0 0 0
Measured output
p = 0 . 0 4 7
C o n t r o l T r e a t m e n t X 0
5 0 0 0 0 1 0 0 0 0 0 1 5 0 0 0 0 2 0 0 0 0 0 2 5 0 0 0 0
Measured output
n . s .
Bar graph Mean ± s.e.m.
Student’s t test
Scatter plot Individual values Mann-Whitney test
Box plot
Median, inter-quartile range and max/min values
Mann-Whitney test
[UPPGIFT]
Cube 𝑋 3
Square 𝑋 2
No transformation
Square root X
Logarithmic log 𝑋 Reciprocal root − 1
𝑋
Reciprocal − 1
𝑋
Transformering av data
Ursprungliga data Transformerade data
Scaling
Unit variance scaling and mean centering
Divide by standard deviation
Subtract mean
https://www.youtube.com/watch?v=kTMHruMz4Is
Vad betyder egentligen p-värdet?
Vad betyder p<0.05? Hur ska vi tolka det?
Vad betyder p-värdet?
Två normalfördelade populationer Skillnad i medelvärde=1
Standardavvikelse=1
Experiment 1:
Slumpmässigt urval av 10 värden från bägge fördelningarna
Skillnad ≈1