o h bromsbelägg på tåg
Anders Holst
De ember 2011
SICS Te hni al Report T2011:14
ISSN 1100-3154
Sammanfattning
Vi har somen delav det Vinnova-nansieradeprojektet DUST
un-dersökthurBayesianskstatistiskmodellering o havvikelsedetektionkan
användasförattanalyseraslitagepåhjulprolero hbromsbeläggpåtåg.
Vivisarhurmanmeddennaanalyskanltreradata,upptä kaonormalt
slitage,o hförutsäga närdetärdagsför underhåll.Resultatenvisaratt
de föreslagna metodernafungerar my ketbra för analys av dentyp av
tidsseriedatamedtrendersomdethandlaromhär,o hattdetgårattfå
Enviktigdelavunderhålletpåtågrörhjulen,o hinnefattarsåvälbromsbelägg
somhjulproler.Bromsbeläggenslitsnerunderanvändning,o hmåstebytasut
innandeinte hinnerslitasnedhelt.Självahjulenslitso ksågradvis,o hmåste
regelbundetsvarvasom för att prolen skahållasig inom a eptabla gränser.
Hjulprolenbestårblandannatavenänshöjd,somökarmedtideno hintefår
bliförstor,o h enänsbreddsomminskarmedtideno hharenundre gräns.
Euromaintsomutförunderhållpåtågharinstalleratoptiskmätutrustning
på en plats längs spåret, som när tåget rullar förbi kan mäta såväl
broms-beläggens kvarvarande tjo klek, som hjulproler. Mätningarna kan användas
för att upptä kanär något bromsbelägg eller något hjuls prol börjar närma
sigsina gränsvärdeno h därförmåste servas.Men mätningarnaöppnar o kså
uppför meravan eradanalys,som att tillexempelförutsägahur långtid det
ärkvartillsservi ekommerattbehövas.Ettannatexempelärattupptä kaom
någotbromsbeläggslitssignikantsnabbareellerlångsammareändeandra,o h
alltsåkanbehövajusterastrotsattdetinteärutslitetän.Detsomkompli erar
analysenärattmätningarnaärrelativtfå(deförekommeroregelbundetmen i
medel a2gångerive kan)o hsamtidigtbehäftademedenvissosäkerheto h
enandelrenafelmätningar.Manmåstealltsåförstltrerabortorimligavärden,
o hsenfråndekvarvarandeuppskattaenlutningsågottdetgår.
ViharsomendelavdetVinnova-nansieradeDUST-projektet(Dynamiskt
Underhåll,planering o h S hemaläggningför Tåg)studerat Euromaints
mät-ningaravänshöjd,änsbreddo hbromsbeläggstjo klek.Viharfåttdatafrån
hjulenpå220vagnarfrånX2000-tågunderstörstadelenav2008.Meddessa
da-taharvimedhjälpavBayesianskstatistiskmodelleringo havvikelsedetektion
gjorttresaker:
•
Bortltreringavfelaktigadatapunkter.•
Detektionavonormaltslitage.•
Prediktionavnärservi ekommerattbehövas.Statistisk modellering
Samtligatre mättastorheterkanmodelleraspåsammasätt: Deförändras
hu-vudsakligenlinjärtövertiden(ellerlinjärtiantalfärdkilometerommanskavara
noga,men idennastudieapproximeradesdettamedtiden),menmätningenav
dem ärbehäftadmed en storbruskomponent.Bruset äravtvåtyper:dels ett
vanligtmätfelsomvikanantaärGaussiskt,delsienminoritetavfallenetthelt
slumpmässigtvärde sominte harnågotmed denverkligastorheten attgöra.I
detförstafalletinnebärdetattmätvärdet
y
somfunktionavtident
kanskrivas:där
δ
är detGaussiskabruset.Detgerfördelningenföry
-värden:P (y | t) =
r q
2π
e
−
q
2
(y−kt−l)
2
där
q
är ettgenomvariansenavbruskomponentenδ
.Viharmätningarfrånettstortantalkomponenter,somvaro henharegna
k
i
o hl
i
.(Visserligen börde varaungefär sammaför olikakomponenter, men eftersomvivilltestaomkomponenternaslitsolikafort,såkanviinteimodellenantaattdeär lika.)
Det första steget är att bygga en Bayesiansk statistisk modell baseratpå
mätdata,vilket innebärattfrånmätdataskaasigenuppfattningomvärdena
påalla
k
i
o hl
i
. Denna modell skasen användas för alla tre uppgifterna: att ltrera data, bedöma lutningen hos respektive storhet, o h förutsäganär detbörjarblidagsförservi e.
Huvudiden med Bayesianskstatistik äratt manistället föratt försöka
hit-ta punktskattningar på
k
i
o hl
i
, beräknar helasannolikhetsfördelningar över dem. Poängen äratt när man har en my ket begränsad mängd träningsdatasomdessutomärbehäftadmedganskamy ketbrus,såblirpunktskattningarna
väldigtosäkra.Genomattiställetgenomhelaberäkningarnatahänsyntillalla
möjligavärdenpåparametrarna(viktat medsina respektivesannolikheter)så
får vi ett betydligt stabilare resultat. Visserligen är resultaten självt en
san-nolikhetsfördelning, o h om osäkerheterna ärstora så kan den ha ganskastor
varians,mendåharviiallafall gjortosäkerhetenexpli it,o h självastorleken
påosäkerhetenkananvändastillattdraanvändbaraslutsatser,somt.exomen
lutningäranmärkningsvärdellerbaraenslumpeekt,ellerhurmy ketmarginal
vibehövernärviplanerarinservi etillfällen.
Sådetförstasteget ärattuttry kamodellen förenlinje,dvs enfördelning
överett
k
o hl
(o hbrusnivånq
)givetenvektorYavmätvärdenvid tidpunk-ternaivektornT:P (k, l, q | Y, T ) ∝ P (k, l, q)P (Y, T | k, l, q)
=
P (k, l, q)
Y
i
P (y
i
| t
i
, k, l, q)
=
q
n/2−1
(2π)
n/2
e
−
1
2
q
P
i
(y
i
−kt
i
−l)
2
Härär
P (k, l, q)
apriori-fördelningenöverparametrarna,somvaltslikformigförk
andl
,o hförq
somP (q) ∝ 1/q
.Noteraigenattdennamodellalltså intebara beskriveren endalinjesomi
linjärregression, utan en hel familj avlinjer som alla skulle kunna gå genom
deuppmättapunkternamedolikasannolikhet.Föratt kunnaanvändadenför
att beräkna fördelningen för ett nytt mätvärde
z
vid tidpunktens
måste vi integreraöveralla möjligalinjer:P (z | Y, T, s) =
ˆ
=
Γ(
n−1
2
)
√
πΓ(
n−2
2
)
·
1
√
nV
·
1
1 +
(x−M)
nV
2
n−1
2
M
=
P y
i
P t
2
i
− s
P t
i
− P y
i
t
i
(P t
i
− sn)
n
P t
2
i
− (
P t
i
)
2
V
=
(n + 1)(P t
2
i
+ s
2
) − (
P t
i
+ s)
2
n
P t
2
i
− (
P t
i
)
2
·
·
P y
2
i
n
−
(P y
i
)
2
n
2
!
−
P y
i
t
i
/n −
P y
i
P t
i
/n
2
2
P t
2
i
/n − (
P t
i
)
2
/n
2
!
DettaärenStudent-t-fördelningöver
z
,medväntevärdeM
o hvariansV
.n
är antaletmätpunkteriY
o hT
.Dettauttry kkanvinuanvändaförattförutsäga varnästamätvärdekommeratthamna.Filtrering
Detförstaviskaanvändamodellenovantillärattltrerabortorimliga
mätvär-denurtidserierna.Detgårtillsåattmanförstantarattallavärdenärkorrekta
o h tränar modellen baserat på dessa. Därefter testar man alla värden med
modellenförattavgörahuravvikandedeärfrånresten.Devärdensomärmest
avvikandeavallasomliggeröverena eptabeltröskeltasbort.Dettaupprepas
fördekvarvarandevärdena,tillsallaärmindreavvikandeäntröskeln.
För att bedöma huravvikandeett mätvärde
z
är, givet vårmodell, så ska mantittapåhurotroligtdetäratt fåettminstlikaovanligtvärde somz
.Det innebär att titta på volymen av "svansen" på fördelningen bortanförz
(o h symmetrisktpåbåda sidoromfördelningen). Använderman attP (z | Y, T, s)
ärenStudent-tmedväntevärdeM
o hvariansV
såfårmanattintegralenöver svansarnablir:¯
A(z) =
Γ(
n−1
2
)
√
πΓ(
n
2
)
nV
(z − M)
2
!
n−2
2
2
F
1
n − 2
2
,
n − 1
2
,
n
2
, −
nV
(z − M)
2
!
där
2
F
1
ärenhypergeometriskfunktion.Dettauttry kanvändervialltsåföratt bedöma hurosannoliktdetärattett mätvärdehörtillsammalinjesomövrigamätvärden. Omsannolikheten ärför låg,såsorteras värdetbortsom orimligt.
Nedanhartröskeln
0.000001
använts.Filtrering av hjulproldata
Figur(1)o h(2) visarmätvärden föränshöjdenförett antal hjulpå ett
an-taltåg.Tidsseriernafördeolikahjulenärutlagdaeftervarandralängsx-axeln.
Inomvarjetidsseriemotsvararx-axelntiden.Figur(1)ärföreltreringav
33.001
-5.90709
0
Attr 1
13285
Figur1:Uppmättavärdenpåänshöjd,föreltrering.
33.001
25.9196
0
Attr 1
13256
0
13285
45.1
18.6
Attr 1
Figur3:Uppmättavärdenpåänsbredd,föreltrering.
0
13282
33.4
29.1
Attr 1
Figur4:Uppmättavärdenpåänsbredd,efterltrering.
trenderalls,men efter såserdet my ket bättre ut. Fortfarande kvarstårdo k
envissbruskomponentpådeuppmättavärdena.
Figur(3)o h(4)visarsammasakföränsbredden.Detserungefärlikadant
utdär.
Notera alltså att det inte är en x övre o h undre gräns som bestämmer
vadsom ltrerasbort, utan gränsernaanpassasdynamiskt till varjelinje, o h
ärolikastoralängsolikapositionerpålinjen.
Slitagehastighet
Medsammamodell kanvio ksåanalyserafördelningen övermöjligalutningar
för lutningen från 0 o h åt det håll man är intresserad av. Fördelningen för
lutningen
k
enbartfås genom att integrerabortl
o hq
. Återigen får man en Student-t-fördelning:P (k | X, T ) =
ˆ
l,q
P (k, l, q | Y, T )
=
Γ(
n−1
2
)
√
πΓ(
n−2
2
)
·
1
√
nV
′
·
1
1 +
(k−M
nV
′
′
)
2
n−1
2
M
′
=
P y
i
t
i
−
P y
i
P t
i
/n
P t
2
i
− (
P t
i
)
2
/n
V
′
=
P
y
2
i
/n−
(
P
y
i
)
2
/n
2
P
t
2
i
/n−
(
P
t
i
)
2
/n
2
−
P
y
i
t
i
/n−
P
y
i
P
t
i
/n
2
P
t
2
i
/n−
(
P
t
i
)
2
/n
2
2
n
VäntevärdetpålutningenärM
′
o hvariansenpålutningen
V
′
.Integralenöver svansenblir:¯
A(k) =
Γ(
n−1
2
)
√
πΓ(
n
2
)
nV
′
(k − M
′
)
2
!
n−2
2
2
F
1
n − 2
2
,
n − 1
2
,
n
2
, −
nV
′
(k − M
′
)
2
!
Ovanståendeuttry k kanvi nu använda omen viss lutning ärrimlig givet
datafören linje.Till exempel kanvitesta hypotesenatt linjeninte lutaralls,
ellerlutaråtandrahålletänmedelvärdetantyder.
Mankan o kså vilja jämföra olikalinjers lutning,för att upptä kasådana
medonormal lutning jämförtmed deandra.Strikt sättskamandåta hänsyn
tillhelafördelningenavmöjligalutningarförvarjelinje,menenenklarelösning
ärattheltenkeltta denförväntadelutningen förvarjelinjeo hlärainienny
avvikelsedetektor.Dåbetraktarviiställetallalinjersolikauppskattadelutningar
k
i
somdragnafrånenGauss-fördelningmedmedelvärdeµ
o hvarians1/q
:P (k) =
r q
2π
e
−
q
2
(k−µ)
2
Analogt med tidigare räkningar kanvi då uttry ka förstfördelningen över
parametrarna
µ
o hq
, därefter sannolikhetsfördelningenför en ny lutningm
givettidigareobservationeravlutningarK
,o hslutligenanomalinfördennya lutningenm
:P (µ, q | K) ∝ P (µ, q)
Y
i
P (k
i
| µ, q) = q
n/2−1
e
−
q
2
P
i
(k
i
−µ)
2
P (m | K) =
ˆ
µ,q
P (m | µ, q)P (µ, q | K)
10512
11479
33.001
26.5597
Attr 1
10512
11479
33.001
26.5597
Attr 2
Figur5:Flänshöjder,därnågraenligtregressionslinjernaverkarslitasåtfelhåll.
10512
11479
33.001
26.5597
Attr 1
10512
11479
33.001
26.5597
Attr 2
10512
11479
33.001
26.5597
Attr 3
10512
11479
33.001
26.5597
Attr 4
Figur6:Samma änshöjdermed sannolikhetsintervallpåslitaget.
=
Γ(
n
2
)
√
πΓ(
n−1
2
)
·
1
p(n + 1)V
′′
·
1
1 +
(m−M
(n+1)V
′′
)
′′
2
n
2
M
′′
=
P k
i
n
V
′′
=
P k
2
i
n
−
(P k
i
)
2
n
2
¯
A(m) =
Γ(
n
2
)
√
πΓ(
n+1
2
)
(n + 1)V
′′
(m − M
′′
)
2
!
n−1
2
2
F
1
n − 1
2
,
n
2
,
n + 1
2
, −
(n + 1)V
′′
(m − M
′′
)
2
!
Meddetta sistauttry kkanvitestaomnågonlutningskiljersigsignikant
frånövrigalutningar.
Test av slitagehastighet av änshöjd
Figur(5)visarendelavänshöjdernafrån gur(2),med regresionslinjer(dvs
väntevärdetför
z
enligtformlernaovan).Flänshöjdenskaalltidökamedtiden, eftersommaterialslitsnedanföränsen.Detstämmero ksåmeddeestamät-ningarna,mennågrauppvisarregressionslinjersomverkarminskaistället.
Frå-ganärnuhurdetta skatolkas ärdetnågotkonstigtsomskermed dessa
63200
64779
59.6867
5
Attr 1
Figur7:Mätserieravtjo klekenpåetturvalav9sty kenbromsbelägg.
63200
64779
59.6867
5
Attr 1
63200
64779
59.6867
5
Attr 2
63200
64779
59.6867
5
Attr 1
Figur8:Sammaurvalavbromsbeläggmedregressionslinjerförslitagetutritade.
Demeddetekteratonormalslitagehastighetärrödmarkerade.
ossett sprattsåattvi råkadefånågraförhögamätvärdenibörjano h några
förlågapåslutet?
Förattsvarapåden sistafrågan,omdetverkarrimligtattdethandlarom
en ren bruseekt, så kan vi använda formlerna för att ta reda på hur troligt
detäratt lutningen ärstörreännoll trotsattmätvärdenatenderar nedåt.En
testavdettapåsamtligalinjervisarmy ketriktigtattingenmed säkerhetkan
sägasluta nedåt. Figur (6) visar samma kurvor men dessutom med övre o h
undre gränser inritade (anomali-gränser) enligt hela fördelningen för
z
. Även om kurvorna ifråga börjar nedåt, såvänder övre gränsen uppåt efter ett tag,vilket visarattdetnnssådanarimligalösningar.
Analysen visaralltså att vi inte kanavfärdahypotesen att det bara ären
bruseekt,dvsdet nnsingenanledningatt troatt dethändernågotkonstigt
med hjulen. Däremot visar det på svagheten med ren regressionsanalys, där
osäkerheteninte framgårlikatydligt.
Onormalt slitage av bromsbelägg
Enintressantfrågaavseendebromsbeläggäromdeslitsolikasnabbt.Förattta
redapådetkanvianvändaavvikelsedetektionenpåslitagehastigheternagenom
63200
64779
59.6867
5
Attr 1
63200
64779
59.6867
5
Attr 2
63200
64779
59.6867
5
Attr 3
63200
64779
59.6867
5
Attr 4
63200
64779
0.227941
0
Attr 6
Figur 9: Samma urval av bromsbelägg,nu med övre o h undre gränser samt
prediktionerutritade.
äravvikande. Totalt hade vi tillgång till data från 3500 bromsbelägg.I gur
(7)visasmätningarfrån ett litet urvalavdem. Figur(8)visarsammabelägg,
mendärregressionslinjernavisas.Treavbeläggenigurenharav
avvikelsede-tektionenutpekatsmedorimligaslitagehastigheter,tvåförlångsamto henför
snabbt.Deärmarkerademed röttiguren.
Prediktion
Den sistauppgiften somåterståräratt förutsäganärslitagetharnått enviss
nivå. Vi känner redanfördelningen föratt få ett visstmätvärde
z
vid en viss tidpunkts
,P (z | Y, T, s)
. Nu vill vi istället veta fördelningen för tidpunktens
då vi når ett visst värdez
,P (s | Y, T, z)
, dvs det värde då det är dags att göra underhåll. En enkel observation ger att dessa är approximativtpro-portionellamot varandra,eftersom derasintegraler ärlikamed varandra(o h
derasequiprobabilitetslinjer ärnästanrakaellerså svagtkurvadeattdetinte
påverkarnämnvärt):sannolikheten att nåett visstvärde föreenvisstidpunkt
ärsammasomsannolikhetenattviddentidpunktenhanåttframtillellerförbi
värdet.Detlättasteärdärförattanvända
P (z | Y, T, s)
förattberäknaettantal värdenpåkurvano hsennormaliseranumeriskt.Igur(9)visasresultatet.Detärsammabromsbeläggsomigur(8),numed
linjerförminstao hstörstarimligavärdeutritade,o hlängstnerfördelningarna
förnärmanförväntasnåtilldennivån.Justeftersomintegralernaärlika,såkan
denutritademinstagränsenfördetuppmättavärdetanvändasförattbestämma
senastetidpunkt för servi e, vid den risknivå man satt i avvikelsedetektionen
närmanräknadeutgränsen.
Genomatt pådettasätt beräknaenhel sannolikhetsfördelning,iställetför
ettendavärde påprognosensommanfår fråntraditionell linjärregression,så
Viharanalyseratslitagepåhjulprolero hbromsbeläggpåtåggenom
Bayesian-skstatistiskmodelleringo havvikelsedetektion.Viharvisathurmankan
ltr-erabortbrus,detekteraavvikandeslitagehastigheter,o hförutsäganärslitaget
harnått envissnivå.
Attltrera bort orimliga värdenmedhjälp avstatistiskavvikelsedetektion
fungerarbrao h kanhanterarelativtstoramängderorimliga värden(sålänge
de är i minoritet). Det ger o kså ett mer dynamiskt sätt att ltrera bort de
orimligavärdenaänattspe i eraxaövreo hundretröskelvärden.Dels
slip-permanmanuelltspe i eramerellermindregodty kligagränser,delsvarierar
gränsernalängs kurvano hfrån kurvatill kurva,varförman kanfåenmy ket
merpre isbortltrering.
Linjärregression,därmanhittar enendalinjebaseratpåmaximum
likeli-hoodo hettrelativtlitetantalmätvärden,ärväldigtkänsligtförslumpmässiga
uktuationeri data.Genomatt användaBayesiansk statistik,modellerarman
fördelningenöverallamöjligalinjer,vilketgerettbetydligtmerrobustresultat,
o hmankanfåredapåhelasannolikhetsfördelningenavdetmanärintresserad
av.I exemplen ovanvisadeden linjäraregressioneniblandpåresultatsom
lu-taråtfelhåll,o halltsåärheltvärdelöstfört.ex.prediktion.DenBayesianska
analysenvisadedäremotattlutningen inte varentydigutan my ket välkunde
varaåt rätthåll.
Prediktionavnärslitagetnåttenvissnivågero ksåen
sannolikhetsfördel-ning. Förutom att man direkt kan se hur säker prediktionen är, så kan man
självbestämmasigförena eptabelrisknivå.Mankano ksåmatavidare
san-nolikhetsfördelningentill ett följande planeringssteg,som medstokastisk
opti-meringtarhänsyntillriskeno hkostnadenavattintehinnasättainunderhåll
itido hhittar denbästaavvägningen.
Avvikelsedetektionavslitagehastigheterfungeradeo ksåbra,o hly kas
hit-ta såvälför snabbt som för långsamtslitage. Sådantkan vara indikationerpå
attnågotbehöverjusterasinnandetledertillallvarligarefel.
Sammanfattningsvis kan sägasatt Bayesianskstatistik o h
avvikelsedetek-tionärmy ketanvändbaraverktygmedstorttillämpningsområde,blandannat