Statistiska metoder f¨or s¨akerhetsanalys
Anna Lindgren – Matematisk statistik
2 september 2013
Anna Lindgren - anna@maths.lth.se Statistiska metoder f¨or s¨akerhetsanalys
Introduktion Exempel Sannolikhetsteori Formalia Syfte och M˚al
Om kursen
▶ Kursen ger 7.5 hp och ¨ar obligatorisk p˚a Riskhantering.
F¨oruts¨atter en grundl¨aggande kurs i statistik/matematisk statistik.
▶ Hemsida:
http://www.maths.lth.se/matstat/kurser/fms065/
▶ L¨arare
▶ Anna Lindgren, MH:136, tel: 046-222 42 76, e-post:
anna@maths.lth.se.
▶ Ted Kronvall
▶ Kurssekreterare Maria L¨ovgren, marial@maths.lth.se, tel:
046-222 45 77, MH:225a–b.
▶ Kursen best˚ar av
▶ f¨orel¨asningar (28 timmar vid 14 tillf¨allen),
▶ ¨ovningar (14 timmar vid 7 tillf¨allen),
▶ obligatoriska dator¨ovningar (12 timmar vid 6 tillf¨allen)
▶ Dator¨ovningarna i Matlab i grupper om tv˚a.
Obligatorisk n¨arvaro.
▶ Kurslitteratur
▶ Rychlik, Ryd´en:Probability and Risk Analysis, An Introduction for Engineers, Springer 2006, ISBN: 978-3-540-24223-9. Finns som e-bok.
▶ F¨or att bli godk¨and p˚a kursen kr¨avs
▶ deltagande vid samtliga sex dator¨ovningar,
▶ godk¨and vid skriftlig tentamen.
▶ Till˚atna hj¨alpmedel vid tentamen:
▶ Kursens formelsamling
▶ Formelsamling i grundkurs i matematisk statistik/statistik
▶ Minir¨aknare
Tentamen l¨ordag 26 oktober kl. 8.00–13.00 i Sparta:A–B.
Omtentamen l¨ordag 11 januari 2014, 8.00–13.00 i MA:10 J.
Anna Lindgren - anna@maths.lth.se Statistiska metoder f¨or s¨akerhetsanalys
Introduktion Exempel Sannolikhetsteori Formalia Syfte och M˚al
Syfte:
Kursen presenterar begrepp och id´eer f¨or grunderna i statistisk behandling av risker. Tyngdpunkten ligger p˚a f¨orst˚aelsen av teorin och metoderna. D¨arf¨or fokuserar kursen p˚a till¨ampningar inom risk och s¨akerhetsanalys.
Eftersom uppskattningen av risker kr¨aver att man kombinerar
information fr˚an olika k¨allor anv¨ands Bayesianska metoder flitigt inom detta omr˚ade. D¨arf¨or ¨agnas en v¨asentlig del av kursen ˚at s˚adana metoder.
F¨or att kunna analysera och prediktera f¨orekomst och frekvens av farliga scenarier scenarios anv¨ands moderna statistiska verktyg, s˚asom
Poisson-regression, deviationsanalys, extremv¨ardesteori och
tr¨oskelmetoder. K¨annedom om s˚adana metoder underl¨attar f¨orst˚aelsen av den roll sannolikhetsteori spelar i riskanalys och hur man p˚a b¨asta s¨att utnyttjar resultatet fr˚an datork¨orningar.
Kursens m˚al
Kunskap och f¨orst˚aelse
F¨or godk¨and kurs skall studenten
▶ kunna skatta olycksintensiteten och modellera dess beroende av n˚agra f¨orklarande variabler
▶ kunna identifiera situationer d¨ar os¨akerheten i de framr¨aknade resultaten inte kan f¨orsummas, ofta i situationer d¨ar m¨angden tillg¨anglig information ¨ar begr¨ansad,
▶ kunna inkludera olika typer av information i en riskuppskattning med Bayesianska metoder.
Anna Lindgren - anna@maths.lth.se Statistiska metoder f¨or s¨akerhetsanalys
Introduktion Exempel Sannolikhetsteori Formalia Syfte och M˚al
Kursens m˚al
F¨ardighet och f¨orm˚aga
F¨or godk¨and kurs skall studenten
▶ kunna l¨asa speciallitteratur inom omr˚adet risk och s¨akerhet d¨ar begrepp som intensitet, sannolikhet och s¨akerhetsindex ofta anv¨ands,
▶ kunna kvantifiera os¨akerheten i ofta f¨orekommande riskm˚att,
▶ kunna validera de modeller som anv¨ants f¨or att ber¨akna riskm˚atten.
Kursens m˚al
V¨arderingsf¨orm˚aga och f¨orh˚allningss¨att F¨or godk¨and kurs skall studenten
▶ visa en st¨orre f¨orst˚aelse f¨or de koncept som anv¨ands inom andra kurser i riskuppskattning,
▶ vara medveten om den roll sannolikhet spelar i riskanalys och kunna anv¨anda programpaket p˚a ett riktigt s¨att.
Anna Lindgren - anna@maths.lth.se Statistiska metoder f¨or s¨akerhetsanalys
Introduktion Exempel Sannolikhetsteori Formalia Syfte och M˚al
Kursinneh˚all
▶ Repetition av de grundl¨aggande begreppen inom sannolikhetsteori:
oberoende, betingad sannolikhet, stokastisk variabel, t¨athets- och sannolikhetsfunktion, v¨antev¨arde, varians och kovarians.
▶ Introduktion och enkla till¨ampningar av Bayes sats, Centrala gr¨ansv¨ardessatsen, Stora talens lag och Sm˚a talens lag.
▶ Klassisk statistisk inferens: ML-metoden, konfidensintervall, hypotespr¨ovning och anpassningstest. Introduktion till bootstrap och delta-metoden f¨or konstruktion av konfidensintervall.
▶ Introduktion till Bayesiansk inferens: prediktiv sannolikhet,
”conjugated priors”, ”credibility interval”.
▶ Skattning av intensiteter och Poissonregression
Kursinneh˚all (forts)
▶ N˚agra begrepp fr˚an s¨akerhets- och riskanalys: felintensitet, s¨akerhetsindex, karakt¨aristiska v¨ardet.
▶ Skattning av kvantiler med POT-metoden.
▶ Introduktion till extremv¨ardesanalys: skattning av designh¨andelsen, t.ex. styrkan hos 100-˚arsstormen, samt uppskattning av os¨akerheten hos skattningarna.
Anna Lindgren - anna@maths.lth.se Statistiska metoder f¨or s¨akerhetsanalys
Introduktion Exempel Sannolikhetsteori Stormar Maxfl¨ode Trafikd¨oda Utsl¨app Fraktgods
Exempel: ”Stormar”
Under perioden 1900–2005 hade Sverige 26 individuella stormar d¨ar skadorna ¨oversteg en million m3skog. Man har noterat tidperioden (dagar) mellan dessa sv˚ara stormar.
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
0 1 2 3 4 5 6 7 8 9 10
dagar
frekvens
▶ F¨ordelning (matematisk modell) f¨or tidpunkten mellan stormar?
▶ Sannolikheten att det ¨ar mindre ¨an 400 dagar mellan tv˚a stormar?
▶ Med vilken ”intensitet” kommer sv˚ara stormar?
▶ Har intensiteten ¨andrats under tidsperioden?
Exempel: ” ˚ Arligt maxfl¨ode”
Figuerna visar maximala ˚arliga fl¨odet (ft3/s) i Feather River under perioden 1902 till 1960. Antag att 200 ft3/s ¨ar en ”kritisk gr¨ans”.
19000 1910 1920 1930 1940 1950 1960
50 100 150 200 250 300
År Flöde (ft3/s)
0 50 100 150 200 250 300
0 2 4 6 8 10 12
Flöde (ft3/s)
▶ F¨ordelning f¨or maximalt ˚arsfl¨ode? Vad ¨ar ”50-˚arsfl¨odet?”
▶ Sannolikheten att fl¨odet ¨overstiger 200 ft3/s? Baserad p˚a samtliga data eller enbart p˚a ”h¨oga fl¨oden”?
Anna Lindgren - anna@maths.lth.se Statistiska metoder f¨or s¨akerhetsanalys
Introduktion Exempel Sannolikhetsteori Stormar Maxfl¨ode Trafikd¨oda Utsl¨app Fraktgods
Exempel: ”Trafikd¨oda”
Nedan visas antalet d¨oda i trafiken i Sverige under perioden 1986–2005. (K¨alla:
V¨agverket)
19850 1990 1995 2000 2005 2010
200 400 600 800 1000
År Antal döda i trafiken
19850 1990 1995 2000 2005 2010
200 400 600 800 1000
År Antal döda i trafiken
▶ En ”enkel linj¨ar regressionsmodell” d¨ar antal d¨oda antas avta linj¨art med tiden r¨acker tydligen ej!
▶ En mer komplicerad modell f¨or att beskriva hur antal d¨oda varierar i tiden inkluderar ocks˚a andra variabler (t.ex. trafikindex, antal m¨anniskor, antal bilar, antal fordonskm). Vi introducerar s.k. Poissonregression. Hur ska vi avg¨ora vilka
Exempel: ”Utsl¨app”
I en dal finns tv˚a fabriker som b˚ada, oberoende av varandra, vissa dagar anv¨ander en kemisk process som ger upphov till att toxiska f¨ororeningar sprids i luften. Anv¨andandet beror inte p˚a veckodag eller s¨asong. Fabrik E1anv¨ander den kemiska processen 150 dagar av de totalt 260
arbetsdagarna under ett ˚ar medan fabrik E2g¨or det under 30 dagar.
(a) Vad ¨ar sannolikheten att fabrik E1sprider f¨ororeningen i dalen en given arbetsdag?
(b) Vad ¨ar sannolikheten att den toxiska f¨ororeningen sprids i dalen en given arbetsdag?
(c) En viss dag visar m¨atningar att den toxiska f¨ororeningen finns i dalen, vad ¨ar sannolikheten att det var fabrik E1som gjorde utsl¨appet?
(d) Vad ¨ar sannolikheten att f¨ororeningen inte sprids i dalen under en arbetsvecka om fem dagar?
(e) Vad ¨ar sannolikheten att den toxiska f¨ororeningen sprids i dalen minst en dag under en arbetsvecka om fem dagar?
Anna Lindgren - anna@maths.lth.se Statistiska metoder f¨or s¨akerhetsanalys
Introduktion Exempel Sannolikhetsteori Stormar Maxfl¨ode Trafikd¨oda Utsl¨app Fraktgods
Exempel: ”Fraktgods”
N¨ar ett f¨oretag skickar fraktgods till en ˚aterf¨ors¨aljare sker detta antingen med lastbil, t˚ag eller flyg. 50% fraktas med lastbil, 30% med t˚ag och 20% med flyg. Andelen transportskadat gods ¨ar 5% med lastbil, 10%
med t˚ag och 2% med flyg.
(a) Hur stor andel av godset kan man r¨akna med f˚ar transportskador?
(b) Om man mottar ett transportskadat gods hur stor ¨ar sannolikheten att det skickats med t˚ag?
Sannolikhetsteori — Grundl¨aggande begrepp
Utfall
Vi har ett experiment (f¨ors¨ok) vars utfall vi inte k¨anner.
Ex: Kasta en t¨arning och notera resultatet
Ex: Betrakta en industri och se om den drabbas av utsl¨app H¨andelse
H¨andelsen A ¨ar ett uttalande om utfallet.
Ex: Kasta en t¨arning: A = ”minst femma”
Ex: Betrakta en industri en dag: B = ”utsl¨app”
Sannolikhet
P(A) = sannolikheten f¨or A
Ex: P(A) = sannolikheten att t¨arningen visar minst femma Ex: P(B) = sannolikheten att industrin drabbas av utsl¨app
Anna Lindgren - anna@maths.lth.se Statistiska metoder f¨or s¨akerhetsanalys
Introduktion Exempel Sannolikhetsteori Grundl¨aggande begrepp Odds
Egenskaper hos P(A)
▶ 0 ≤ P(A) ≤ 1
▶ Om P(A) = 0 s˚a intr¨affar A aldrig
▶ Om P(A) = 1 s˚a intr¨affar A alltid
▶ P(inte A) = 1 − P(A)
Frekvenstolkning
Om vi upprepar experimentet m˚anga g˚anger, oberoende av varandra, kan vi tolka P(A) som relativa frekvensen:
Ex: P(A) = P(minst femma) = antal femmor och sexor totalt antal kast Ex: P(B) = P(utsl¨app) = antal dagar med utsl¨app
totalt antal dagar
Additionssatsen
P(A ∪ B) = P(A) + P(B) − P(A ∩ B) dvs P(minst en av A och B intr¨affar) =
=P(A intr¨affar) + P(B intr¨affar) − P(b˚ade A och B intr¨affar) Oberoende
▶ Om A och B ¨ar oberoende s˚a ¨ar P(A ∩ B) = P(A) ⋅ P(B).
▶ Om P(A ∩ B) = P(A) ⋅ P(B) s˚a ¨ar A och B ¨ar oberoende.
Betingad sannolikhet
Vi vet att A intr¨affade. Vad ¨ar d˚a sannolikheten att B (ocks˚a) intr¨affar?
P(B ∣ A) = P(A ∩ B) P(A)
A och B oberoende ger P(B ∣ A) = P(B).
Anna Lindgren - anna@maths.lth.se Statistiska metoder f¨or s¨akerhetsanalys
Introduktion Exempel Sannolikhetsteori Grundl¨aggande begrepp Odds
Satsen om total sannolikhet
Om h¨andelserna A1,. . . ,Aninte kan intr¨affa samtidigt och tillsammans fyller upp hela utfallsrummet s˚a g¨aller att
P(B) =
n
∑
i=1
P(B ∣ Ai) ⋅P(Ai)
Ex: Fraktgods (a)
P(lastbil) = 0.5, P(t˚ag) = 0.3, P(flyg) = 0.2, P(skada ∣ lastbil) = 0.05, P(skada ∣ t˚ag) = 0.10, P(skada ∣ flyg) = 0.02.
P(skada) = P(skada ∣ lastbil) ⋅ P(lastbil) + P(skada ∣ t˚ag) ⋅ P(t˚ag) + +P(skada ∣ flyg) ⋅ P(flyg)
=0.05 ⋅ 0.5 + 0.10 ⋅ 0.3 + 0.02 ⋅ 0.2 = 0.059
Bayes sats
Utnyttja att definitionen av betingad sannolikhet medf¨or att P(B ∣ A) ⋅ P(A) = P(B ∩ A) = P(A ∣ B) ⋅ P(B)
P(A ∣ B) = P(B ∣ A) ⋅ P(A) P(B)
Ex: Fraktgods (b)
P(t˚ag ∣ skada) = P(skada ∩ t˚ag)
P(skada) = P(skada ∣ t˚ag) ⋅ P(t˚ag) P(skada)
= 0.10 ⋅ 0.3
0.05 ⋅ 0.5 + 0.10 ⋅ 0.3 + 0.02 ⋅ 0.2
= 0.03
0.059 =0.51
Anna Lindgren - anna@maths.lth.se Statistiska metoder f¨or s¨akerhetsanalys
Introduktion Exempel Sannolikhetsteori Grundl¨aggande begrepp Odds
Odds
F¨or tv˚a h¨andelser A1och A2¨ar oddsen tv˚a positiva tal q1och q2s˚a att q1
q2
= P(A1) P(A2) F¨or flera uteslutande h¨andelser A1,. . . ,An:
qi
qj = P(Ai)
P(Aj) P(Ai) = qi
q1+ ⋅ ⋅ ⋅ +qn
Ex: Fraktgods
Vi har ett gods, vad ¨ar oddsen f¨or lastbil, t˚ag resp. flyg?
P(lastbil) P(t˚ag) = 0.5
0.3 = 5
3, P(lastbil) P(flyg) = 0.5
0.2 = 5
2, P(t˚ag)
P(flyg) = 0.3 0.2 = 3
2
Ex: Fraktgods (forts)
Antag nu att vi f˚ar ny information, n¨amligen att godset ¨ar skadat, vad ¨ar d˚a oddsen f¨or lastbil, t˚ag resp. flyg?
Betingade sannolikheter!
P(lastbil ∣ skadat)
P(t˚ag ∣ skadat) = P(skadat ∣ lastbil) ⋅P(skadat)P(lastbil) P(skadat ∣ t˚ag) ⋅P(skadat)P(t˚ag) )
= P(skadat ∣ lastbil)
P(skadat ∣ t˚ag) ⋅ P(lastbil) P(t˚ag)
| {z }
gamla oddset 5:3
P(lastbil ∣ skadat)
P(flyg ∣ skadat) = . . . P(t˚ag ∣ skadat) P(flyg ∣ skadat) = . . .
Anna Lindgren - anna@maths.lth.se Statistiska metoder f¨or s¨akerhetsanalys
Introduktion Exempel Sannolikhetsteori Grundl¨aggande begrepp Odds
Ex: Fraktgods (forts) Uppdaterade odds:
qpostlastbil=P(skadat ∣ lastbil) ⋅ qpriorlastbil =0.05 ⋅ 5 = 0.25 qpostt˚ag =P(skadat ∣ t˚ag) ⋅ qpriort˚ag =0.10 ⋅ 3 = 0.30 qpostflyg =P(skadat ∣ flyg) ⋅ qpriorflyg =0.02 ⋅ 2 = 0.04 Nya oddsen f¨or lastbil : t˚ag : flyg ¨ar 25 : 30 : 4
A priori och a posteriori odds
Vi har sinsemellan uteslutande h¨andelser A1,. . . ,An. Gamla odds qprior1 , . . . ,qpriorn kallas a priori odds.
Nya odds, n¨ar vi f˚att information om att h¨andelsen B har intr¨affat, qpost1 , . . . ,qpostn kallas a posteriori odds d¨ar
qposti =P(B ∣ Ai) ⋅qpriori