• No results found

Slutfasstyrning av missil med explicit prediktionsreglering

N/A
N/A
Protected

Academic year: 2021

Share "Slutfasstyrning av missil med explicit prediktionsreglering"

Copied!
75
0
0

Loading.... (view fulltext now)

Full text

(1)

Institutionen f¨or systemteknik

Department of Electrical Engineering

Examensarbete

Slutfasstyrning av missil med explicit

prediktionsreglering

Examensarbete utf¨ort i Reglerteknik vid Tekniska h¨ogskolan i Link¨oping

av Mats Ekstr¨om LITH-ISY-EX-3619-2005

Link¨oping 2005

Department of Electrical Engineering Link¨opings tekniska h¨ogskola Link¨opings universitet Link¨opings universitet SE-581 83 Link¨oping, Sweden 581 83 Link¨oping

(2)
(3)

Slutfasstyrning av missil med explicit

prediktionsreglering

Examensarbete utf¨

ort i Reglerteknik

vid Tekniska h¨

ogskolan i Link¨

oping

av

Mats Ekstr¨om LITH-ISY-EX-3619-2005

Handledare: Dr. Thomas Svantesson

Saab Bofors Dynamics AB

Dr. Ragnar Wallin

isy, Link¨opings universitet

Examinator: Doc. Anders Hansson

isy, Link¨opings universitet

(4)
(5)

Avdelning, Institution Division, Department

Division of Automatic Control Department of Electrical Engineering Link¨opings universitet

S-581 83 Link¨oping, Sweden

Datum Date 2005-02-09 Spr˚ak Language  Svenska/Swedish  Engelska/English  ⊠ Rapporttyp Report category  Licentiatavhandling  Examensarbete  C-uppsats  D-uppsats  ¨Ovrig rapport  ⊠

URL f¨or elektronisk version

http://www.ep.liu.se/exjobb/isy/2005/3619/ ISBN

— ISRN

LITH-ISY-EX-3619-2005 Serietitel och serienummer Title of series, numbering

ISSN —

Titel Title

Slutfasstyrning av missil med explicit prediktionsreglering Terminal Guidance using Explicit Model Predictive Control

F¨orfattare Author

Mats Ekstr¨om

Sammanfattning Abstract

Arbetet har utf¨orts p˚a Saab Bofors Dynamics AB i Link¨oping och dess syfte ¨ar att unders¨oka m¨ojligheten att applicera teorin f¨or prediktionsreglering, Model Predictive Control (MPC), p˚a guidance systemet i en missil av typen Medium Range Air-to-Air Missiles (MRAAM). ¨Aven implementering via Explicit MPC har unders¨okts.

I tidigare studier har det visat sig att den moderna slutfasstyrningsalgorit-men Linear Quadratic Augslutfasstyrningsalgorit-mented Proportional Navigation (LQAPN), som ˚aterkopplar missilens acceleration och rotation, uppvisar en b¨attre prestanda ¨an de mer klassiska styrlagarna. Det fr¨amsta intresset med denna studie ¨ar d¨arf¨or att unders¨oka hur tillvida en styrlag baserad p˚a MPC kan m¨ata sig med dessa resultat. F¨ordelen med att anv¨anda MPC ¨ar framf¨orallt att man kan ta h¨ansyn till styrsignalbegr¨ansningar p˚a ett direkt och intuitivt s¨att.

En nackdel med MPC ¨ar ber¨akningstiden. P˚a senare ˚ar har dock forskning bedrivits f¨or att ta fram en variant av MPC som ber¨aknar styrsignalen explicit som en affin funktion av det aktuella tillst˚andet. Denna metod kallas Explicit MPC och har betraktats som en separat metod i detta arbete.

Styrlagen baserad p˚a MPC kallas i detta arbete f¨or Model Predictive Control Augmented Proportional Navigation (MPCAPN) och utm¨arker sig framf¨orallt i tv˚a fall. Dels d˚a s˚a kallade h¨andelsestyrda simuleringar studeras, d˚a den uppvisar ett klart b¨attre resultat ¨an vad som erh˚alls med en styrlag baserad p˚a Linear Quadratic Augmented Proportional Navigation (LQAPN). ¨Aven vid ber¨akningar av skjutzoner blir resultaten ibland b¨attre. Framf¨orallt f¨orb¨attras den inre skjutgr¨ansen f¨or flygscenariet d˚a m˚alet utf¨or en s˚a kallad ”tunnelroll”.

Nyckelord

Keywords Explicit MPC, modellbaserad slutfasstyrning, MPC, m˚alf¨oljning, parameterstyr-ning, slutfasstyrning

(6)
(7)

Sammanfattning

Arbetet har utf¨orts p˚a Saab Bofors Dynamics AB i Link¨oping och dess syfte ¨ar att unders¨oka m¨ojligheten att applicera teorin f¨or prediktionsreglering, MPC, p˚a gui-dance systemet i en missil av typen Medium Range Air-to-Air Missiles (MRAAM).

¨

Aven implementering via Explicit MPC har unders¨okts.

I tidigare studier har det visat sig att den moderna slutfasstyrningsalgoritmen Li-near Quadratic Augmented Proportional Navigation (LQAPN), som ˚aterkopplar missilens acceleration och rotation, uppvisar en b¨attre prestanda ¨an de mer klas-siska styrlagarna. Det fr¨amsta intresset med denna studie ¨ar d¨arf¨or att unders¨oka hur tillvida en styrlag baserad p˚a MPC kan m¨ata sig med dessa resultat. F¨ordelen med att anv¨anda MPC ¨ar framf¨orallt att man kan ta h¨ansyn till styrsignalbe-gr¨ansningar p˚a ett direkt och intuitivt s¨att.

En nackdel med MPC ¨ar ber¨akningstiden. P˚a senare ˚ar har dock forskning be-drivits f¨or att ta fram en variant av MPC som ber¨aknar styrsignalen explicit som en affin funktion av det aktuella tillst˚andet. Denna metod kallas Explicit MPC och har betraktats som en separat metod i detta arbete.

Styrlagen baserad p˚a MPC kallas i detta arbete f¨or Model Predictive Control Aug-mented Proportional Navigation (MPCAPN) och utm¨arker sig framf¨orallt i tv˚a fall. Dels d˚a s˚a kallade h¨andelsestyrda simuleringar studeras, d˚a den uppvisar ett klart b¨attre resultat ¨an vad som erh˚alls med en styrlag baserad p˚a LQAPN. ¨Aven vid ber¨akningar av skjutzoner blir resultaten ibland b¨attre. Framf¨orallt f¨orb¨attras den inre skjutgr¨ansen f¨or flygscenariet d˚a m˚alet utf¨or en s˚a kallad ”tunnelroll”.

(8)
(9)

orord

Jag skulle framf¨orallt vilja tacka min handledare p˚a Saab Bofors Dynamics, Tho-mas Svantesson, f¨or att han alltid har funnits till hands n¨ar jag beh¨ovt hj¨alp. Jag vill ¨aven tacka Alberto Bemporad f¨or att i samband med en kurs i Link¨oping, september 2004, ha hj¨alpt mig med n˚agra reglertekniskt viktiga detaljer.

Vidare vill jag ¨aven tacka min handledare p˚a Link¨opings Tekniska H¨ogskola Rag-nar Wallin, min examinator Anders Hansson, min exjobbskollega David Rosdal, min chef Torbj¨orn Crona som bidrog till att arbetet blev av samt resten av perso-nalen p˚a Saab Bofors Dynamics plan 5 som har bidragit mycket positivt till min trivsel under arbetet.

Link¨oping, januari 2005 Mats Ekstr¨om

(10)
(11)

Inneh˚

all

1 Inledning 1 1.1 Bakgrund . . . 1 1.2 M˚als¨attning . . . 2 1.3 Begr¨ansningar . . . 3 1.4 Tidigare arbeten . . . 3 1.5 Rapportens uppl¨agg . . . 3 2 Prediktionsreglering 5 2.1 Linj¨ar prediktion . . . 5 2.2 V¨ardefunktionen . . . 6

2.2.1 Att l¨osa QP-problemet . . . 8

2.3 Designparametrar . . . 8

2.4 Explicit MPC . . . 9

2.4.1 mp-QP . . . 10

2.4.2 Komplexitet . . . 16

3 Koordinat- och missilsystem 17 3.1 Koordinatsystem . . . 17

3.1.1 Intertiellt kartesiskt koordinatsystem . . . 17

3.1.2 Missilens kroppsfasta koordinatsystem . . . 17

3.1.3 M˚alets kroppsfasta koordinatsystem . . . 17

3.1.4 Syftlinjefast koordinatsystem . . . 17

3.1.5 Transformationsmatriser . . . 18

3.2 Missilens olika delar . . . 18

3.2.1 M˚als¨okare . . . 19 3.2.2 Guidance . . . 19 3.2.3 Autopilot . . . 19 3.2.4 Roderservo . . . 20 3.2.5 Navigering . . . 20 3.3 Missilmodell . . . 20 4 M˚alf¨oljning 23 4.1 M˚almodell . . . 23 4.2 M˚alf¨oljningsfilter . . . 25 4.2.1 AFMM . . . 25 ix

(12)

5.2 Styrlagar . . . 28 5.2.1 PN . . . 29 5.2.2 APN . . . 30 5.2.3 SOG . . . 30 5.2.4 LQAPN . . . 31 5.2.5 MPCAPN . . . 32 5.2.6 Explicit MPCAPN . . . 36 5.2.7 Koordinattransformationer . . . 40 6 Simuleringar 41 6.1 Scenarier . . . 41 6.1.1 Scenario 1 . . . 41 6.1.2 Scenario 2 . . . 41 6.1.3 Scenario 3 . . . 41 6.2 Monte-Carlo simuleringar . . . 42 6.3 H¨andelsestyrda simuleringar . . . 44 6.4 Skjutzoner . . . 47 6.5 Robusthet . . . 52

7 Slutsatser och framtida arbete 55 7.1 MPC . . . 55

7.2 Explicit MPC . . . 56

7.3 Sammanfattning . . . 56

7.4 F¨orslag till framtida arbete . . . 56

Litteraturf¨orteckning 57

A Notationer 59

(13)

Kapitel 1

Inledning

1.1

Bakgrund

Prediktionsreglering, Model Predictive Control (MPC), har under senare ˚ar blivit en allt mer vedertagen och anv¨and reglerstrategi. Detta i takt med datorernas utveckling och den d¨arav uppkomna m¨ojligheten att utf¨ora tyngre ber¨akningar i realtid. Den stora f¨ordelen med MPC ¨ar att man p˚a ett direkt och intuitivt s¨att tar h¨ansyn till givna bivillkor p˚a t.ex. styrsignaler eller processens utsignaler. En missil ¨ar uppbyggd av ett flertal olika delsystem som samverkar. N˚agra av de mest v¨asentliga delarna ¨ar

• M˚alf¨oljning • Navigering • Guidance • Autopilot

Den del som kommer att behandlas i denna rapport ¨ar guidance. Detta delsy-stem erh˚aller aktuellt flygtillst˚and fr˚an navigeringssystemet, samt information om m˚alets flygtillst˚and fr˚an m˚alf¨oljningssystemet. Denna information anv¨ands sedan av delsystemet guidance f¨or att ber¨akna en kommenderad acceleration i gir- och tippled. Dessa blir sedan referensv¨arden till autopiloten, d¨ar de ger upphov till en translation av missilen i h¨ojd- och sidled s˚a att missilen tr¨affar m˚alet.

En missil kan dock inte accelerera obegr¨ansat. Detta talar f¨or en anv¨andning av MPC, d˚a denna metod tar h¨ansyn till dessa begr¨ansningar. I Figur 1.1 p˚avisas f¨ordelen med att explicit ta h¨ansyn till givna bivillkor p˚a kommenderad accelera-tion. En styrlag som ber¨aknas med klassisk Linear Quadratic (LQ)-teknik ger ett l¨angre insv¨angningsf¨orlopp j¨amf¨ort med en styrlag ber¨aknad med MPC. F¨or ett noggrannare resonemang kring denna figur se avsnitt 5.2.5.

(14)

0 0.2 0.4 0.6 0.8 1 1.2 −0.1 −0.05 0 0.05 0.1 0.15 0.2 MPC vs. LQ r s [rad/s] 0 0.2 0.4 0.6 0.8 1 1.2 −600 −400 −200 0 200 400 600 u [m/s 2] tid [s]

Figur 1.1.Illustration av hur ett initialt fel p˚a syftlinjesrotationen rs regleras till noll

med styrsignalen u d˚a inga yttre st¨orningar f¨oreligger. Heldragen kurva (—) anger MPC medan streckad kurva (- -) anger LQ.

D˚a en missil utg¨or ett mycket snabbt system uppkommer problemet att ber¨aknings-tiden online f¨or MPC blir stor. En relativt ny metod som syftar till att offline utf¨ora dessa tunga ber¨akningar kallas f¨or Explicit MPC.

Projektet ¨ar utf¨ort p˚a initiativ av Saab Bofors Dynamics AB i Link¨oping.

1.2

als¨

attning

Syftet med arbetet ¨ar att unders¨oka om styrlagar baserade p˚a MPC och Ex-plicit MPC kan ge b¨attre resultat ¨an tidigare unders¨okta reglerstrategier pre-senterade i [19] och [20]. I dessa arbeten studeras styrlagarna Proportional Na-vigation (PN), Augmented Proportional NaNa-vigation (APN), Simplified Optimal Guidance-law (SOG) samt Linear Quadratic Augmented Proportional Naviga-tion (LQAPN), vilka h¨ar beskrivs i kapitel 5.

(15)

1.3 Begr¨ansningar 3

1.3

Begr¨

ansningar

Simuleringsmodellen ¨ar en s˚a kallad Missile Combat Simulator (MICOS) modell och ¨ar implementerad i Matlab. Detta ¨ar en kondenserad modell d¨ar missilens fullst¨andiga dynamik ej betraktas. En annan begr¨ansning ¨ar att man endast ar-betar med 5 frihetsgrader ist¨allet f¨or 6. Detta inneb¨ar att ingen h¨ansyn tas till rollkanalen, vilket i sin tur g¨or att man undviker korskopplingar i systemet.

1.4

Tidigare arbeten

Tekniken att anv¨anda MPC i guidance har tidigare studerats i [12], men d˚a under enklare former. Andra studier d¨ar h¨ansyn tas till accelerationsbegr¨ansningar i guidance ¨ar [10], [16] och [17]. Dessa baseras dock inte p˚a MPC utan anv¨ander sig av en styrlag som ben¨amns Optimal Guidance Law (OGL). N˚agra studier d¨ar Explicit MPC till¨ampas p˚a guidance har hittills inte f¨orekommit till f¨orfattarens k¨annedom.

1.5

Rapportens uppl¨

agg

I kapitel 2 ges en grundl¨aggande teori¨oversikt f¨or MPC och Explicit MPC. I kapitel 3 ˚aterfinns en kort beskrivning av missilens uppbyggnad samt aerodynamiska och flygmekaniska egenskaper. H¨ar introduceras ¨aven den matematiska modell som guidancesystemet anv¨ander sig av. Implementeringen av de olika styrlagarna i simuleringsmilj¨on beskrivs i kapitel 5. Simuleringsresultat samt diskussion kring dessa ges i kapitel 6. Avslutningsvis behandlas slutsatser och kommentarer i kapitel 7. Notationer ˚aterfinns i appendix A.

(16)
(17)

Kapitel 2

Prediktionsreglering

Prediktionsreglering, eller Model Predictive Control (MPC), har under senare ˚ar blivit en allt mer vedertagen och anv¨and reglerstrategi. Detta i takt med datorernas utveckling och den d¨arav uppkomna m¨ojligheten att utf¨ora tyngre ber¨akningar i realtid. Den stora f¨ordelen med MPC ¨ar att man p˚a ett l¨att och intuitivt s¨att tar h¨ansyn till givna bivillkor. Grundid´en ¨ar att med hj¨alp av en given processmodell ber¨akna en optimal styrsignalssekvens vid varje tidssteg. En enkel algoritm h¨amtad fr˚an [9] ser ut som f¨oljer:

1. Vid aktuell tidpunkt t predikteras ett antal framtida tillst˚and ˆx(t + k|t), k = 1, ..., Ny. Dessa kommer att bero p˚a den optimala styrsignalsekvensen

u(t + j), j = 0, 1, ..., Nu samt de aktuella skattade tillst˚anden vid tiden t.

2. St¨all upp en v¨ardefunktion baserat p˚a dessa variabler och optimera med avseende p˚a u(t + j), j = 0, 1, ..., Nu.

3. Applicera styrsignalen u(t).

4. Inv¨anta n¨asta tidpunkt, t + 1, och g˚a till steg 1.

Eftersom prediktionshorisonten f¨orskjuts fram˚at med tiden kallas denna metod ¨aven f¨or Receding Horizon Control (RHC). Detta kan j¨amf¨oras med en bilist vars synhorisont ¨andras med tiden.

2.1

Linj¨

ar prediktion

Ett diskretiserat linj¨art system utan systembrus beskrivs av tillst˚andsmodellen x(t + 1) = Ax(t) + Bu(t). (2.1) Utg˚aende fr˚an denna modell erh˚alls genom iteration, se [7], framtida predikterade tillst˚and

X = ¯T x(t) + ¯SU (2.2) 5

(18)

d¨ar X =                x(t + 1) x(t + 2) .. . x(t + Ny)                U =                u(t) u(t + 1) .. . u(t + Nu− 1)                , (2.3) ¯ T =                A A2 .. . ANy                ¯ S =                B 0 · · · 0 AB B · · · 0 .. . ... . .. ... ANy−1B ANy−2B · · · B                .

Observera att notationer och matrissammans¨attning ej helt st¨ammer ¨overrens med de i [7]. I (2.3) f¨oruts¨atts dessutom att Ny= Nu. Om detta inte ¨ar fallet kommer

matrisen S att beh¨ova modifieras.

2.2

ardefunktionen

M˚alet ¨ar att f˚a den predikterade styrsignalen optimal i n˚agot avseende. Detta g¨ors genom att skapa en v¨ardefunktion som sedan minimeras med avseende p˚a styr-signalerna u(t + j), j = 0, 1, ..., Nu. Kriterium som ska minimeras kan se ut p˚a

olika s¨att. I detta arbete studeras ett kvadratiskt kriterie med motiveringen att det finns effektiva Quadratic Programming (QP)-l¨osare, samt att det ger ett likartat beteende som en LQ-l¨osning, vilket har visat sig framg˚angsrikt i tidigare studier av slutfasstyrning [19].

Man vill allts˚a l¨osa optimeringsproblemet, [3], min

U={u∆ t,ut+1,...,ut+Nu−1}

n J(U , x) = xTt+Ny|tP xt+Ny|t + Ny−1 X k=0 xTt+k|tQxt+k|t+ uTt+k|tRut+k|t o , (2.4) d˚a ymin ≤ yt+k|t ≤ ymax, k = 1, . . . , Nc, umin ≤ ut+k|t ≤ umax, k = 0, . . . , Nc, xt|t = x(t) xt+k+1|t = Axt+k|t+ But+k|t, k ≥ 0, yt+k|t = Cxt+k|t, k ≥ 0, ut+k|t = Kxt+k|t, Nu≤ k < Ny.

(19)

2.2 V¨ardefunktionen 7 H¨ar anger xt+Ny|t det predikterade tillst˚andet Ny tidssteg fram˚at i tiden,

base-rat p˚a m¨atdata vid tiden t. Detta optimeringsproblem l¨oses online och p˚a s˚a vis erh˚alls en optimal styrsignalsekvens. I ekvation (2.4) f¨oruts¨atts att Q = QT  0, R = RT ≻ 0, P  0, (Q1/2, A) ¨ar detekterbara, K ¨ar en linj¨ar ˚aterkoppling, Ny, Nu, Nc ¨ar utsignal-, styrsignal- och begr¨ansningshorisont, d¨ar Nu ≤ Ny och

Nc≤ Ny− 1.

Valet av K kan g¨oras p˚a ett flertal s¨att. D˚a det ¨oppna systemet som ska regleras i detta arbete kan bli instabilt, se kapitel 3, beh¨ovs ett K med stabiliserande egen-skaper. Ett s¨att att uppn˚a detta ¨ar att v¨alja K = KLQ, se [18]. Detta erh˚alls genom

att ber¨akna K och P i ekvation (2.4) som l¨osningarna till det ickebegr¨ansade LQ problemet,

KLQ = −(R + BTP B)−1BTP A (2.5a)

P = (A + BKLQ)TP(A + BKLQ) + KLQRKLQ+ (2.5b)

Detta ¨ar en omskrivning av den station¨ara Riccatiekvationen. Q och R ¨ar straff-matriserna fr˚an ekvation (2.4). Detta val indikerar att efter Nu tidssteg sl˚as

re-gulatorn om till ickebegr¨ansad LQ. Att K och P v¨aljs enligt (2.5) medf¨or att v¨ardefunktionen i (2.4) kan skrivas som

J(U , x) = ∞ X k=Ny xTt+k|tQxt+k|t+ uTt+k|tRut+k|t + Ny−1 X k=Nu xTt+k|tQxt+k|t+ uTt+k|tRut+k|t + Nu−1 X k=0 xTt+k|tQxt+k|t+ uTt+k|tRut+k|t, (2.6)

d¨ar de tv˚a f¨orsta termerna utg¨or v¨ardefunktionen f¨or klassisk LQ-teori f¨or k ≥ Nu. Dessa kan d¨arf¨or ers¨attas med termen xTt+Nu|tP xt+Nu|t. Observera att det

samma inte g¨aller f¨or den tredje termen d¨ar begr¨ansningarna ¨ar aktiva. Man f˚ar d˚a v¨ardefunktionen J(U , x) = xTt+Nu|tP xt+Nu|t+ Nu−1 X k=0 xTt+k|tQxt+k|t+ uTt+k|tRut+k|t (2.7)

och kan konstatera att J(U , x) h¨ar har samma form som i (2.4), men med Ny =

Nu. S˚aledes anv¨ands vidare i detta arbete

Ny = Nu = N. (2.8)

Detta ger en stabil l¨osning f¨orutsatt att systemet under de Nusamplen har hunnit

(20)

Under avsaknad av begr¨ansningar p˚a utsignalen upptr¨ader aldrig n˚agot konver-gensproblem f¨or QP-l¨osaren. Nc kan d¨arf¨or v¨aljas mindre ¨an o¨andligheten, se [3].

Ett naturligt val ¨ar d˚a

Nc = N − 1. (2.9)

2.2.1

Att l¨

osa QP-problemet

F¨or att kunna angripa problemet med en standard QP-l¨osare kan man med hj¨alp av ekvation (2.2) skriva om ekvation (2.4) p˚a formen

V = min U 1 2U T HU+ xT(t)F U (2.10) d˚a GU ≤ W

F¨or bevis se [7]. H och F i ekvation (2.10) blir

H = ¯STQ ¯¯S+ ¯R (2.11) F = ( ¯STQ ¯¯T)T, (2.12) d¨ar ¯ Q =                     Q 0 0 · · · 0 0 Q 0 · · · 0 .. . ... . .. ... ... 0 0 · · · Q 0 0 0 · · · 0 P                     (2.13a) ¯ R =                R 0 · · · 0 0 R · · · 0 .. . ... . .. ... 0 · · · 0 R                (2.13b)

och Q, R och P ¨ar straffmatriserna fr˚an (2.4). P ber¨aknas enligt ekvation (2.5). Goch W svarar mot begr¨ansningarna fr˚an (2.4). I detta arbete begr¨ansas endast styrsignalen.

L¨osningen till ett enligt ovan angivet QP-problem kan se ut som i Figur 2.1.

2.3

Designparametrar

Eftersom Ny och Nu v¨aljs som Ny = Nu = N och straffmatrisen P v¨aljs enligt

ekvation (2.5) medf¨or detta att de enda prametrarna som beh¨over v¨aljas ¨ar N samt straffmatriserna Q och R. Eftersom MPC arbetar med ett tidsdiskret system kr¨aver detta att systemet samplas, vilket medf¨or att ¨aven samplingstiden Tskan

(21)

2.4 Explicit MPC 9 Optimum utan bivillkor Tillåtet område Optimum med bivillkor u(k) u(k + 1) J(u) Implementering enligt “Receding Horizon”

Figur 2.1.Niv˚akurvor f¨or ett QP-problem med Nu= 2.

2.4

Explicit MPC

En av de stora svagheterna hos MPC ¨ar tidsaspekten f¨or ber¨akningen online. Vid varje sampel g¨ors en onlineber¨akning som resulterar i en optimal styrlag ¨over en finit tidshorisont. I v˚arat fall kr¨aver detta att ett QP-problem l¨oses online varje sampel. Detta har gjort att MPC har begr¨ansats till l˚angsamma processer, som t.ex. oljeraffinaderier, med samplingstider p˚a flera minuter eller timmar. Under se-nare ˚ar har det dock publicerats ett flertal artiklar som syftar till att s¨oka en expli-cit l¨osningsmetod till problemet och s˚aledes kunna utf¨ora optimeringsf¨orfarandet offline, d.v.s. att p˚a f¨orhand ha ber¨aknat ett samband mellan u(t) och x(t) som

u(t) = f (x(t)), ∀t ≥ 0. (2.14) Detta tillv¨agag˚angss¨att ben¨amns Explicit Model Predictive Control (EMPC). Op-timeringsproblemet man vill l¨osa ¨ar fortfarande det i ekvation (2.4). F¨or framtiden ¨ar det dock f¨ordelaktigt att skriva om ekvation (2.10) p˚a formen

Vz = min z 1 2z THz (2.15) d˚a Gz ≤ W + Sx(t),

(22)

d¨ar z = U + H∆ −1FTx(t), (2.16) Vz = V −∆ 1 2x T(−F H−1 FT)x, (2.17) S = GH∆ −1FT. (2.18)

Detta eftersom vi d˚a f˚ar parametervektorn x(t) endast i h¨ogerledet p˚a bivillkoret.

2.4.1

multi-parametric Quadratic Programming (mp-QP)

I detta kapitel s¨oks en algoritm f¨or att ta fram den optimala styrsekvensen U∗(x) samt v¨ardefunktionen Vz = J(U∗(x)) som explicita funktioner av x som h¨ar

be-traktas som en parametervektor (d¨arav namnet ”multi-parametric”). Enligt [3] f˚as denna l¨osning genom att applicera Karush-Kuhn-Tucker (KKT) - se [15] - villko-ren

Hz+ GTλ = 0, λ∈ Rq, (2.19a) λi(Giz− Wi− Six) = 0, i = 1, . . . , q, (2.19b)

λ ≥ 0, (2.19c)

Gz ≤ W + Sx, (2.19d)

d¨ar index i indikerar den i-te raden. L¨oser man ut z ur ekvation (2.19) f˚ar man

z = H−1GTλ. (2.20)

F¨oljande definition baseras p˚a en definition i [21] men ¨ar analog med de resonemang som f¨ors i [3].

Definition 1 L˚at z∗(x) vara den optimala l¨osningen till ekvation (2.15) f¨or ett givet x0. Vi definierar d˚a aktiva bivillkor som ˜G

i

z∗(x) − ˜Wi− ˜Six0= 0, och

ej aktiva bivillkorsom de bivillkor d˚a Giz∗(x) − Wi− Six0< 0.

Aktiva bivillkor ¨ar med andra ord de bivillkor som sl˚as i d˚a den optimala l¨osningen z∗(x

0) appliceras p˚a systemet. F¨or en illustration se Figur 2.1. Tillst˚andet x0

v¨aljs i regel som mittpunkten i det aktuella omr˚adet (Chebyshev-centrum). En mer utf¨orlig beskrivning av hur x0 v¨aljs ges i [3].

Sats 1 L˚atCR0utg¨ora m¨angden av alla x f¨or vilka ˜G, ˜S och ˜W utg¨or de aktiva

bivillkoren. D˚a ¨ar den optimala l¨osningen z∗samt dess lagrangemultiplikatorer λ∗ entydigt definierade affina funktioner av x inom den kritiska regionen,CR0.

Den affina funktionen f¨or z ges enligt [3] av

(23)

2.4 Explicit MPC 11

och det kritiska omr˚adet ges av sambanden

GH−1G˜T( ˜GH−1G˜T)−1( ˜W + ˜Sx) ≤ W + Sx (2.22a) −( ˜GH−1G˜T)−1( ˜W + ˜Sx) ≥ 0, (2.22b) d¨ar den f¨orsta m¨angden ¨ar ett resultat av ekvation (2.19) medan den andra svarar mot faktumet att lagrangemultiplikatorerna inte f˚ar vara negativa, ekvation (2.19). Ett exempel i tv˚a dimensioner h¨amtat fr˚an [3] kommer att anv¨andas f¨or att steg f¨or steg ˚ask˚adligg¨ora framlagd teori.

Exempel 2.1

Betrakta ett andra ordningens system y(t) = 2

p2+ 3p + 2 u(t), (2.23)

d¨ar p ¨ar deriveringsoperatorn d/dt. Samplar man detta system med Ts = 0.1

sekunder erh˚alls tillst˚andsekvationen x(t + 1) =     0.7326 −0.0861 0.1722 0.9909     x(t) +     0.0609 0.0064     u(t) y(t) = 0 1.4142  x(t). (2.24)

Man vill reglera detta system samtidigt som man uppfyller bivillkoren

−2 ≤ u(t) ≤ 2. (2.25)

F¨or detta syfte konstrueras en MPC-regulator baserad p˚a optimeringsproblemet i (2.4) med Q = I och R = 0.01. P v¨aljs dock ej enligt ekvation (2.5) utan som l¨osningen till Lyapunovfunktionen P = ATP A+ Q. Detta kan g¨oras eftersom vi i detta exempel arbetar med ett ¨oppet system som ¨ar stabilt. Prediktionshorisont, styrsignalhorisont och begr¨ansningshorisont v¨aljs som Ny= Nu= 2, Nc= 1. Valet

av P svarar mot att man s¨atter ut+k= 0 f¨or k ≥ 2 och minimerar ∞

X

k=0

xTt+k|txt+k|t+ 0.01u2t+k|t. (2.26)

F¨orsta steget i f¨orloppet ¨ar att ta fram det f¨orsta kritiska omr˚adet kallat CR0.

Detta definieras av ekvationerna i (2.22) och kan generellt skrivas p˚a formen CR0

= {x ∈ X : Ax ≤ b}, (2.27) det vill s¨aga som en polytop d¨ar X ¨ar m¨angden av alla till˚atna tillst˚and x. I detta exempel ges omr˚adet CR0 i Figur 2.2.

(24)

Figur 2.2.Kritiska regionen.

Den affina funktionen u∗(x), som f˚as via ekvation (2.16) och (2.21), blir f¨or denna region

u∗(x) = −5.92 −6.89 

x. (2.28)

Noteras b¨or att ˜G, ˜S och ˜W i detta fall ¨ar tomma m¨angder d˚a det ej finns n˚agra aktiva bivillkor. Omr˚adet definieras endast av olikheten 0 ≤ W +Sx, vilket i detta exempel ¨ar ett resultat fr˚an styrsignalbegr¨ansningen i (2.25). Eftersom bivillkoren i detta omr˚ade ej ¨ar aktiva s˚a ¨ar den resulterande styrlagen i (2.28) inget annat ¨an l¨osningen till motsvarande diskreta LQ-problem.

Efter att man har tagit fram den kritiska regionen delas den kvarvarande m¨angden upp i mindre regioner. Den kvarvarande m¨angden definieras av

CRrest ∆= X \ CR0. (2.29)

CRrestkan sedan delas upp genom att man successivt bortser fr˚an begr¨ansningarna

i (2.27), rad f¨or rad. Ri ∆ =  x∈ X : A i x> bi Ajx≤ bj, ∀j < i  , i = 1, . . . , m, (2.30) d¨ar m = dim(b). Index j i t.ex. Aj anger j-te raden i matrisen A. Motsvarande g¨aller f¨or index i.

(25)

2.4 Explicit MPC 13

Exempel 2.2

Forts¨attning fr˚an Exempel 2.1.

Hur CRrestdelas upp enligt (2.30) ses i Figur 2.3.

(a) (b)

(c) (d)

Figur 2.3.Uppdelning av CRrest

, steg f¨or steg.

F¨orfarandet att ta fram kritiska regionen CR0 samt den optimala styrsignalen

u∗(x) upprepas sedan i varje omr˚ade R

i. Detta tills att hela omr˚adet X ¨ar t¨ackt

av kritiska regioner, CRi

0. Ofta kan redundanta omr˚aden sl˚as samman till st¨orre

(26)

Exempel 2.3

Forts¨attning fr˚an Exempel 2.1 och 2.2 .

F¨or att ta fram den slutgiltiga mp-QP l¨osning har i detta arbete Matlab-toolboxen Multi-Parametric Toolbox (MPT), [13], anv¨ants. En komersiell toolbox, Model Predictive Control Toolbox (MPCT), ¨ar under utveckling av A. Bemporad, N.L. Ricker och M. Morari. Denna toolbox har dock inte varit tillg¨anglig under detta arbete.

Problemet l¨oses med hj¨alp av Matlab-kommandot mpt_control. Resultatet finns illustrerat i Figur 2.4. F¨or fullst¨andig Matlab-kod se Appendix B.

(a) (b)

Figur 2.4.mp-QP l¨osningen. I (b) illustreras hur tillst˚andet x = [1.0139, 0.8592] styrs till origo.

Det existerar dock effektivare algoritmer f¨or att ta fram mp-QP l¨osningen. En s˚adan behandlas i [21] men tas inte upp i detta arbete.

Online anv¨ands sedan Matlab-kommandot mpt_getInput f¨or att erh˚alla den optimala styrsignalen u∗(x) som ges p˚a en affin form Fi

x+ gi enligt ekvation

(2.16) och (2.21). Index i avser h¨ar det aktuella omr˚adet CRi

0. Utifr˚an aktuellt

tillst˚and x s¨oker algoritmen igenom alla omr˚aden fr˚an i = 1 och upp˚at tills att den hittar ett omr˚ade CRi

0 som passar. Den optimala styrsignalen ges sedan av

(27)

2.4 Explicit MPC 15

framlagt i [22]. Denna l¨osning anv¨ands dock inte i detta arbete.

Exempel 2.4

Forts¨attning fr˚an Exempel 2.1, 2.2 och 2.3. De affina l¨osningarna Fix+ gi f¨or omr˚adena CRi

(28)

Resultaten ¨ar h¨amtade fr˚an [3]. Noteras b¨or att t.ex. regionerna #1, #3 och #4 al-la har u∗(x) = 2, men att de trots detta har definierats som tre separata omr˚aden. Anledningen till detta ¨ar att n¨asta komponent i styrsignalsekvensen U∗ skiljer sig ˚at dem emellan.

2.4.2

Komplexitet

Komplexiteten f¨or mp-QP problemet best¨ams framf¨orallt av tre saker: 1. Antalet bivillkor (p˚averkar mest).

2. Antalet fria styrsignalsteg Nu (p˚averkar mycket).

3. Antalet tillst˚and i x (p˚averkar lite).

Att Nu p˚averkar mycket kan ses i Figur 2.5. Denna ¨ar h¨amtad fr˚an [2] och visar

p˚a ett exponentiellt samband mellan Nu och ber¨akningstiden. Att ¨aven antalet

omr˚aden ¨okar snabbt med storleken p˚a Nu g¨or att tidsvinsten f¨or ber¨akningen

online ¨ats upp om man vill ha m˚anga fria styrsignalsteg.

Figur 2.5.Komplexitet f¨or mp-QP l¨osningen.

Sammanfattningsvis kan man s¨aga att s˚a l¨ange Nu h˚alls liten och man inte har

f¨or m˚anga bivillkor s˚a kommer man att vinna i ber¨akningstid. Observera dock att det kommer att kr¨avas ¨okad lagringskapacitet d˚a mp-QP l¨osningen kr¨aver minnesutrymme.

(29)

Kapitel 3

Koordinat- och missilsystem

Missilen som betraktas i detta arbete ¨ar av typen Medium Range Air-to-Air Missi-les (MRAAM) och ¨ar en modern h¨oghastighetsrobot som h˚aller en hastighet runt Mach 2.5.

3.1

Koordinatsystem

Fyra olika koordinatsystem har anv¨ants i detta arbete.

3.1.1

Intertiellt kartesiskt koordinatsystem

Detta koordinatsystem har x-koordinaten, xi, pekandes i nordlig riktning, y-koordinaten,

yi, pekandes i ¨ostlig riktning och z-koordinaten, zi, pekandes ned˚at.

3.1.2

Missilens kroppsfasta koordinatsystem

Detta ¨ar som namnet antyder ett internt koordinatsystem i missilen. x-koordinaten, xb, pekar i missilens l¨angdriktning, y-koordinaten, yb, ¨ar riktad ˚at h¨oger och

z-koordinaten, zb, ¨ar riktad ned˚at.

3.1.3

alets kroppsfasta koordinatsystem

Fungerar precis likadant som missilens kroppsfasta koordinatsystem och indexeras som xbt, ybtoch zbt.

3.1.4

Syftlinjefast koordinatsystem

Det syftlinjefasta koordinatsystemet erh˚alls genom att utg˚a fr˚an missilens kropps-fasta koordinatsystem och sedan vrida detta en vinkel ν1runt zb-axeln och d¨arefter

vinkeln ν2 runt den nya yb-axeln. Det syftlinjefasta koordinatsystemts x-axel, xs,

ska efter detta peka l¨angs syftlinjen mot m˚alet - se Figur 3.1. 17

(30)

Missil Mål xi yi xb yb xbt ybt xs ys ν1

Figur 3.1.De fyra koordinatsystemen. Missilen och m˚alet ses ovanifr˚an.

3.1.5

Transformationsmatriser

F¨or att transformera vektorer mellan de olika koordinatsystem anv¨ands transfor-mationsmatriserna Tib (fr˚an inertiellt koordinatsystem till missilens kroppsfasta

koordinatsystem), Tbs (fr˚an missilens kroppsfasta koordinatsystem till

syftlinje-fast koordinatsystem) samt Tbti (fr˚an m˚alets kroppsfasta koordinatsystem till det

inertiella koordinatsystemet).

3.2

Missilens olika delar

En missil ¨ar uppbyggd av flera delsystem. I Figur 3.2 ses en principskiss ¨over de samverkande delarna.

H¨ar ¨ar r det relativa avst˚andet mellan m˚al och missil, ˙r ¨ar relativ radiell has-tighet, ν1 och ν2 ¨ar vinklar till m˚alet, aycoch azc anger ¨onskad acceleration, δac,

δec och δrc¨ar kommenderade roderutslag, δa, δeoch δr ¨ar utf¨orda roderutslag, ay

och az anger utf¨ord acceleration och ωy och ωz ¨ar missilens resulterande rotation

(31)

3.2 Missilens olika delar 19

Målsökare Guidance Autopilot Roderservon

Missilen Navigering Mättning r ˙ r ν1 ν2 ayc azc ay az ωy ωz δac δec δrc δa δe δr

Figur 3.2.Principskiss ¨over samverkan mellan olika delsystem i en missil.

Givetvis fl¨odar det mer information ¨an vad som ¨ar angivet i denna figur, men dessa ¨ar inte avg¨orande f¨or denna studie.

3.2.1

als¨

okare

Det finns tv˚a typer av m˚als¨okare som dominerar marknaden, radardoppler och Infrared (IR). En radardopplerm˚als¨okare m¨ater relativa avst˚andet r, radiell has-tighet ˙r samt vinklarna till m˚alet, ν1 och ν2. Med en IR-m˚als¨okare ¨ar det dock

endast m¨ojligt att m¨ata m˚alvinklarna ν1 och ν2. Generellt g¨aller f¨oljaktligen att

radaroppler ¨ar b¨attre p˚a att m¨ata avst˚and, medan IR l¨ampar sig b¨attre n¨ar det g¨aller att m¨ata vinklar till m˚alet. I denna studie kommer dels radardoppler att anv¨andas, samt en kombination av radardoppler och IR.

I verkligheten aktiveras m˚als¨okaren f¨orst n¨ar missilen n¨armar sig m˚alet eftersom den har begr¨ansad r¨ackvidd. Innan detta sker sk¨ots i de flesta fall instyrning-en av missilinstyrning-en via l¨ank fr˚an vapenb¨araren. I simuleringsmilj¨on anv¨ands dock en m˚als¨okare med o¨andlig r¨ackvidd som ¨ar aktiv under hela flygf¨orloppet. M˚als¨okarens dynamik modelleras inte och anses vara skrovfast, vilket inneb¨ar att den alltid ¨ar riktad l¨angs missilens kroppsfasta x-axel, xb.

3.2.2

Guidance

Delsystemet guidance erh˚aller aktuellt flygtillst˚and fr˚an navigeringssystemet, samt information om m˚alets flygtillst˚and fr˚an m˚alf¨oljningssystemet i m˚als¨okaren. Denna information anv¨ands sedan av guidance f¨or att ber¨akna en kommenderad accele-ration i gir-/tippled. Dessa blir sedan referensv¨arden till autopiloten. Som tidigare har n¨amnts finns det givetvis begr¨ansningar p˚a hur stora accelerationer missilen kan ta ut. Detta modelleras genom attt l¨agga in en m¨attning mellan guidance och autopiloten. Det ger en ¨ovre och en undre begr¨ansning p˚a styrsignalen. Be-gr¨ansningen ¨ar vald till ±500 m/s2.

3.2.3

Autopilot

Autopiloten erh˚aller referensv¨arden f¨or accelerationer i gir- och tippled fr˚an gui-dance och resulterar i ¨onskade roderutslag.

(32)

3.2.4

Roderservo

De ¨onskade roderutslagen fr˚an styrautomaten kommenderas till roderservon som p˚averkar robotens styrfenor.

3.2.5

Navigering

Missilen agerar och en m¨angd intern data avl¨ases fr˚an sensorer. Dessa anv¨ands bland annat av navigeringssystemet f¨or att skatta missilens aktuella flygtillst˚and. ˚

Aterkoppling sker sedan till delsystemen guidance och autopilot.

3.3

Missilmodell

Missilmodellen ¨ar en MICOS-modell. Detta inneb¨ar att ist¨allet f¨or att anv¨anda separata modeller f¨or autopilot och skrovdynamik har dessa slagits ihop till en kondenserad modell. Om vi v¨aljer att betrakta ¨overf¨oringsfunktionen fr˚an kom-menderad acceleration i girled, as

yc, till utf¨ord acceleration, asym, ges denna enligt

[1] av asym = 1 1 +ω0p +ω12 0p 2 a s yc, (3.1)

d¨ar ω0¨ar det ˚aterkopplade systemets od¨ampade egenfrekvens och ζ ¨ar den relativa

d¨ampningen. p ¨ar deriveringsoperatorn d/dt. ¨

Overf¨oringsfunktionen fr˚an kommenderad acceleration till rotation runt missilens z-axel, ωz, ges av ωz = 1 Vm · 1 + τsp 1 + 2ζω0p +ω12 0p 2 a s yc, (3.2)

d¨ar Vm= |Vm| ¨ar missilens hastighet och τsdefinieras i (3.12). Ekvation (3.1) och

(3.2) ger

ωz =

1 Vm

(1 + τsp) asym. (3.3)

Ekvation (3.1), (3.2) och (3.3) skrivna i tidsdom¨anen blir asym+ 2ζ ω0˙a s ym+ 1 ω2 0 ¨ asym = asyc (3.4) Vm  ωz+ 2ζ ω0 ˙ωz+ 1 ω2 0 ¨ ωz  = asyc+ τs˙asyc (3.5) ωz = 1 Vm as ym+ τs Vm ˙as ym. (3.6) (3.7) Om vi tar ekvation (3.5) minus (3.4) erh˚alls med hj¨alp av ekvation (3.6)

2Vmζ ω0 ˙ωz+ Vm ω2 0 ¨ ωz+  τs− 2ζ ω0  ˙asym− 1 ω2 0 ¨ asym = τs˙asyc. (3.8)

(33)

3.3 Missilmodell 21 Genom att integrera ekvation (3.8) en g˚ang och utnyttja ekvation (3.6) erh˚alls

˙ωz= 1 τs  (1 − 2ζω0τs)ωz+ 1 Vm (ω0τs(2ζ − ω0τs) − 1)asym  +τsω 2 0 Vm asyc. (3.9)

Sammanfattningsvis kan man skriva ekvation (3.6) och (3.9) p˚a tillst˚andsforn en-ligt     ˙as ym ˙ωz     = 1 τs     −1 Vm 1 Vm · (ω0τs(2ζ − ω0τs) − 1) 1 − ω0τs2ζ         as ym ωz     +     0 ω20τs Vm     a s yc. (3.10)

En tillst˚andsmodell i tippled kan h¨arledas analogt med ovanst˚aende resonemang. Resultatet blir det samma s˚a n¨ar som p˚a n˚agra tecken

    ˙as zm ˙ωy     = 1 τs     −1 −Vm −V1m · (ω0τs(2ζ − ω0τs) − 1) 1 − ω0τs2ζ         as zm ωy     +     0 −ω20τs Vm     a s zc. (3.11)

Anledningen till tecken¨andringen ¨ar att ett positivt ωy g¨or att missilens nos

rote-ras upp˚at, vilket i sin tur medf¨or en translation upp˚at. Eftersom z-axeln ¨ar riktad ned˚at ger detta ett ombytt tecken j¨amf¨ort med modellen i girled.

Parametrarna f¨or en modell i girled v¨aljs enligt [1] till

ζ ≈ 0.7 (3.12a) K2 = dm 3Iz (3.12b) τs = mVm qSCCβ,trim (3.12c) τω = r τ s 2K2u (3.12d) ω0 = r 1 + K2τωu τωτs , (3.12e)

d¨ar d ¨ar missilens referensl¨angd, m ¨ar missilens massa, Iz¨ar missilens

tr¨oghetsmo-ment runt z-axeln, q ¨ar dynamiskt tryck, S ¨ar missilens referensarea, CCβ,trim ¨ar

en koefficient f¨or sidkraft hos en trimmad missil och u ¨ar missilens hastighet i x-led. I tippled f˚as samma resultat d˚a parametrarna Iy och CNα,trim v¨aljs enligt

[20] till

Iy = Iz (3.13a)

(34)
(35)

Kapitel 4

alf¨

oljning

4.1

almodell

Den m˚almodell som har anv¨ants i detta arbete anv¨ander sig av en kombination av kartesiska och pol¨ara koordinater och har sitt ursprung fr˚an examensarbetet [4]. M˚alets position ges i kartesiska, medan dess hastighet ges i pol¨ara. F¨ordelen med detta j¨amf¨ort med en rent kartesisk modell ¨ar enligt [20] att vid en koordinerad sv¨ang kommer hastigheten vtsamt accelerationerna axt, ayt, aztatt vara

konstan-ta. M˚alf¨olningsfiltret i avsnitt 4.2 f˚ar d˚a ett konstant v¨arde att konvergera emot. Nackdelen ¨ar att tillst˚andsmodellen blir olinj¨ar.

De variabler som illustreras i Figur 4.1 beskrivs av ekvationerna ˙xit = |vt| cos(ϕ) cos(θ),

˙yit = |vt| sin(ϕ) cos(θ),

˙zit = −|vt| sin(θ), ˙ vt = axt, ˙ ϕ = −ayt |vt| , (4.1) ˙θ = azt |vt| , ˙axt = w1, ˙ayt = w2, ˙azt = w3, d¨ar xi

t, yti och zit¨ar m˚alets position i det intertiella koordinatsystemet (se kapitel

3), vt= |vt| ¨ar m˚alets hastighet, axt, ayt och azt anger m˚alets acceleration, ϕ ¨ar

b¨aringen f¨or m˚alets hastighetsvektor medan θ ¨ar elevationen f¨or densamma. Insig-nalerna w1, w2 och w3 ¨ar drivande systembrus.

Om man g¨or antagandet att m˚als¨okaren befinner sig i origo i det intertiella koor-23

(36)

xi t yi t zit vt axt ayt azt ϕ θ

Figur 4.1.Illustration av de aktuella koordinaterna i m˚almodellen.

dinatsystemet kommer relativt avst˚and mellan m˚al och m˚als¨okare r relativ radiell hastighet ˙r samt kardanvinklarna ν1 och ν2 (se Figur 3.1) att ges av

r = q (xi t)2+ (yit)2+ (zit)2+ e1, ν1 = arctan(y i t xi t ) + e2, ν2 = − arctan   zi t q xi t 2 + yi t 2  + e3, (4.2) ˙r = h ˙R, Ri |R| + e4,

d¨ar R ¨ar den uppm¨atta kartesiska positionsvektorn och ˙R ¨ar den kartesiska has-tighetsvektorn. Dessa definieras av

R =          xi t yit zi t          , (4.3) ˙ R =          vtcos(ϕ) cos(θ) vtsin(ϕ) cos(θ) −vtcos(θ)          . (4.4)

Vidare ¨ar ei det drivande m¨atbruset. Observera att om m˚als¨okaren inte befinner

(37)

4.2 M˚alf¨oljningsfilter 25

M˚almodellen kan allts˚a beskrivas som en olinj¨ar modell p˚a formen ˙x = f (x) + w z= h(x) + e (4.5) d¨ar x=xit yit zti vt ϕ θ axt ayt azt   T , z=r ν1 ν2 ˙r   T (4.6) och f (x) f˚as fr˚an (4.1) och h(x) fr˚an (4.2) .

4.2

alf¨

oljningsfilter

Det har gjorts m˚anga studier g¨allande olika typer m˚alf¨oljningsalgoritmer. De tv˚a metoder som enligt [4] visat sig ge b¨ast resultat ¨ar Adaptive Filtering through Mul-tiple Models (AFMM) och Interactive MulMul-tiple Models (IMM). Dessa ¨ar relativt komplexa och baseras p˚a multipla modeller. I detta arbete anv¨ands endast AFMM. Detta med motiveringen att algoritmerna f¨orvisso uppvisar samma prestanda, men att IMM enligt [4] ¨ar mer ber¨akningskr¨avande. Ett problem med multipla modeller ¨ar att antalet hypoteser v¨axer exponentiellt och man m˚aste d¨arf¨or finna v¨agar f¨or att begr¨ansa antalet filter samtidigt som man uppeh˚aller god prestanda.

4.2.1

AFMM

AFMM baseras p˚a N stycken filter, i detta arbete Extended Kalman Filter (EKF), med vardera M stycken modeller. Varje filter baseras p˚a n˚agon man¨over som m˚alet kan f¨orv¨antas g¨ora. I detta arbete anv¨ands M = 2. Detta betyder att varje filter har en modell som ¨ar aktiv d˚a man¨over sker och en modell f¨or normaltillst˚andet n¨ar man¨over ej sker. Dessa modeller skiljer sig ˚at endast genom att de har olika systembrusmatriser. Systembrusets kovarians ges allts˚a av

Qt =



Qm, med sannolikhet µ

Qn, med sannolikhet 1 − µ , (4.7) d¨ar µ ¨ar sannolikheten att man¨over sker och m och n betyder ”maneuver” respek-tive ”non maneuver”.

I varje tidpunkt g¨ors en skattning f¨or varje filter av sannolikheten att m˚alets ak-tuella tillst˚and beskrivs b¨ast av just detta filter. Det filter som ¨ar mest sannolikt delas d˚a i tv˚a delar. En del som beskriver fallet d˚a man¨over sker och en som be-skriver fallet d˚a man¨over ej sker. F¨or att antalet filter ska h˚allas konstant tas det filter med l¨agst sannolikhet bort. Eftersom detta sker i varje sampel ¨ar det inte troligt att en man¨over hinner detekteras under denna korta tid. Man har d¨arf¨or ett minsta v¨arde p˚a livsl¨angden L hos filtren f¨or att de inte ska f¨orkastas felaktigt.

(38)

Andra parametrar ¨ar ρ som anger hur ofta filterbesk¨arning ska ske, samt Rf som

anv¨ands f¨or att skala m¨atbruskovariansen. Exempel 4.1 ¨ar h¨amtat fr˚an [4]. Exempel 4.1

I detta exempel ¨ar N = 3, M = 2 och L = 2. En illustration av f¨orloppet ges i Figur 4.2. t1 t2 t3 t4 Filter 1 Filter 2 Filter 3 (0.1; 2; n) (0.7; 2; m) (0.2; 1; n) (0.05; 1; m) (0.75; 3; n) (0.2; 2; n) (0.4; 2; n) (0.35; 4; n) (0.25; 1; m) (0.7; 3; n) (0.2; 1; m) (0.1; 2; m) (p; L; type) p= sannolikhet L= livsl¨angd

type= man¨over (m), ej man¨over (n)

Figur 4.2.AFMM med 3 filter och 2 modeller.

t1 Filter nummer 2 ¨ar mest sannolik. Detta filter delas upp i de tv˚a modellerna

man¨over (m) och ej man¨over (n). Filter 1 har l¨agst sannolikhet och stryks d¨arf¨or.

t2 Filter 2 har fortfarande st¨orst sannolikhet och delas d¨arf¨or. Filter 1 har l¨agst

sannolikhet men dess livsl¨angd ¨ar mindre ¨an minsta till˚atna livsl¨angden 2 och stryks d¨arf¨or inte. Ist¨allet stryks Filter 3.

t3 Filter 1 har nu st¨orst sannolikhet och delas d¨arf¨or. Filter 3 har l¨agst sannolikhet

men dess livsl¨angd ¨ar mindre ¨an minsta till˚atna livsl¨angden 2 och stryks d¨arf¨or inte. Ist¨allet stryks Filter 2.

(39)

Kapitel 5

Slutfasstyrning

En m˚als¨okande missil genomg˚ar under sin flygning tre olika faser. Dessa delas vanligtvis in i

• Separationsfas. • Banfas. • Slutfas.

Separationsfasen ¨ar d˚a missilen l¨amnar vapenb¨araren. Under separationsfasen ¨ar det viktigt att roboten har ett lugnt beteende s˚a att vapenb¨araren riskfritt kan vika undan. Huvuddelen av flygtiden utg¨ors av banfasen. Denna kan se olika ut beroende p˚a hur man vill att missilen ska inkomma mot sitt m˚al. Vanligast ¨ar att man under banfasen l˚ater missilen stiga i h¨ojdled och p˚a s˚a vis kan attackera m˚alet snett ovanifr˚an. I detta arbete behandlas endast slutfasen. H¨ar ska missilen ha ett aggressivt beteende och kunna reagera snabbt p˚a m˚alets man¨ovrer. I detta arbete definieras slutfasen av

|Rrel| ≤ 2000 m, (5.1)

d¨ar |Rrel| ¨ar det relativa avst˚andet mellan m˚al och missil. Man kan ¨aven t¨anka

sig att definiera slutfasen utg˚aende fr˚an den kvarvarande flygtiden, tgo.

5.1

Optimal styrning

En optimal styrlag finns h¨arledd i [14] och baseras p˚a att man minimerar v¨ardefunktionen

J = E{xT(tf)Sfx(tf) + tf Z t0 uTN udx}. (5.2) d¨ar x = [xsr, yrs, zrs, ˙xsr, ˙ysr, ˙zrs, asxt, asyt, aszt, asxm, asym, aszm]. (5.3) 27

(40)

H¨ar ¨ar Sf en blockdiagonal matris som inneh˚aller straffmatrisen H. Denna

straf-far avst˚andet till m˚alet vid tidpunkten tf, d¨ar tf ¨ar tidpunkten f¨or tr¨aff. Matrisen

N ¨ar en viktmatris som straffar styrsignalerna u1 = asyc och u2 = aszc och t0 ¨ar

tidpunkten d˚a missilen avfyras. E{·} ¨ar v¨antev¨ardesoperatorn. I ¨ovrigt ¨ar xs r, yrs

och zs

r relativa avst˚anden mellan m˚alet och missilen medan ˙xsr, ˙ysr och ˙zrs anger

relativa n¨armandehastigheter. M˚alets accelerationer betecknas som as

xt, asyt samt

as

zt och missilens accelerationer av asxm, asym samt aszm.

Designparametrar h¨ar ¨ar straffmatriserna H och N . Om man har ett h˚art straff p˚a u, d.v.s. stort N , s˚a h˚aller man styrsignalerna l˚aga och styrningen blir mjuk. Om man ist¨allet v¨aljer H stor f˚ar man en mer aggressiv styrning.

I f¨oljande ekvationer antas att missilens kommenderade acceleration till utf¨ord acceleration kan approximeras med ett f¨orsta ordningens filter med bandbredden ωb. P˚a samma s¨att approximeras m˚alets motsvarande ¨overf¨oringsfunktion med ett

f¨orsta ordningens filter med bandbredden λ - f¨or en noggrannare h¨arledning se [14]. Optimal kommenderad acceleration blir

asyc = Λy  Vcrs+ D(tgo,λy)asyt t2 go − D(tgo,ωb,gir)asym t2 go  (5.4a) aszc = Λz  −Vcqs+D(tgo,λz)a s zt t2 go − D(tgo,ωb,tipp)aszm t2 go  (5.4b) d¨ar D(s, h) = (e−sh− I3+ sh)h−2. (5.5) Index c i as

yc anger att det ¨ar en kommenderad acceleration och index s betyder

att accelerationen ¨ar angiven i det syftlinjefasta koordinatsystemet, se kapitel 3. Λy och Λz ¨ar navigeringskonstanter, rs ¨ar syftlinjesrotationen kring zb-axeln och

qs ¨ar syftlinjesrotationen kring yb-axeln eftersom m˚als¨okaren ¨ar skrovfast. Den

˚aterst˚aende flygtiden tgo, approximeras med

tgo =

Rrel

Vc

, (5.6)

d¨ar Rrel = |Rrel| ¨ar avst˚andet mellan m˚al och missil och Vc ¨ar den relativa

n¨armandehastigheten

Vc = −

hRrel, ˙Rreli

|Rrel| . (5.7)

Optimal styrning ben¨amns ofta som Optimal Guidance Law (OGL).

5.2

Styrlagar

De styrlagar som har unders¨okts i detta arbete ¨ar de fr˚an [19] samt tv˚a nya som baseras p˚a MPC och Explicit MPC - Model Predictive Control Augmented Propor-tional Navigation (MPCAPN) och Explicit MPCAPN. En kortfattad beskrivning ges f¨orst av styrlagarna Proportional Navigation (PN), Augmented Proportional

(41)

5.2 Styrlagar 29

Navigation (APN), Simplified Optimal Guidance-law (SOG) och LQ. D¨arefter f¨oljer en mer omfattande redog¨orelse f¨or hur MPCAPN och Explicit MPCAPN har implementerats.

5.2.1

PN

Syftb¨aringsstyrning, Proportional Navigation (PN), ¨ar en gammal bepr¨ovad styr-lag vars teori studerades redan i slutet av andra v¨arldskriget. Den bygger p˚a att om riktningen till m˚alet hela tiden h˚alls konstant s˚a kommer missilen att tr¨affa sitt m˚al. Missilen f¨ors¨oker med andra ord att h˚alla en kollisionskurs med m˚alet ist¨allet f¨or att ˚aka rakt mot det. En tv˚adimensionell illustration ges i Figur 5.1.

Missil Mål Rrel xb yb Vm Vt σ

Figur 5.1.Illustration av syftb¨aringsstyrning i tv˚a dimensioner.

Att riktningen till m˚alet h˚alls konstant betyder att vinkeln σ ska h˚allas konstant. Detta inneb¨ar att syftlinjesrotationen

rs = ˙σ (5.8)

ska vara noll. Tidsderivatan av syftlinjesrotationen ges enligt [19] av ˙rs = 1

Rrel

2Vcrs+ asyt− asym . (5.9)

PN bygger p˚a approximationen att m˚alets acceleration ¨ar noll. Man s¨ager ¨aven att missilens bandbredd ωb¨ar o¨andlig. Under dessa antaganden kan ekvation (5.4)

(42)

skrivas som

asyc = ΛyVcrs (5.10a)

aszc = −ΛzVcqs. (5.10b)

PN ¨ar med andra ord ett specialfall av den optimala styrlagen i avsnitt 5.1. Navi-geringskonstanterna Λy och Λz har i enlighet med [19] valts till

Λy = Λz = 3.5. (5.11)

5.2.2

APN

Augmented Proportional Navigation (APN) fungerar i stort som PN med det undantaget att m˚alets acceleration antas vara konstant ist¨allet f¨or noll. Detta ger att (5.4) kan skrivas som

asyc = ΛyVcrs+Λ2yasyt (5.12a)

aszc = −ΛzVcqs+Λ2zaszt. (5.12b)

F¨or analys av gr¨ansv¨arden d˚a λ → 0 och ωb→ ∞ se [19]. Navigeringskonstanterna

Λy och Λz har i valts enligt (5.11). Eftersom m˚alets acceleration h¨ar inte antas

vara noll betyder det att as

yt och aszt i (5.12) beh¨over skattas. Detta g¨ors enligt

metoden i kapitel 4.

5.2.3

SOG

I likhet med APN kr¨aver ocks˚a Simplified Optimal Guidance-law (SOG) att m˚alets acceleration skattas. Ut¨over detta g¨ors heller inte antagandet att missilens band-bredd ωb→ ∞. Man ¨ar med andra ord tvungen att skatta ¨aven denna. Detta g¨ors

enligt [8] fr˚an sambandet ωb = ω0

q

1 − 2ζ2+p1 + (1 − 2ζ2)2, (5.13)

d¨ar ω0¨ar det ˚aterkopplade systemets od¨ampade egenfrekvens och ζ ¨ar den relativa

d¨ampningen. Dessa ges enligt definitionerna i (3.12).

Observera att (5.4) ¨ar h¨arledda f¨or ett f¨orsta ordningens system, medan det aktu-ella systemet i detta arbete ¨ar ett andra ordningens system som ges av ekvation (3.1). Enligt [20] kan man dock se bandbredden f¨or systemet i ekvation (3.1) som en tillfredst¨allande god approximation i detta sammanhang. Styrlagen f¨or SOG ges enligt de ovan angivna antagandena, samt ekvation (5.4), av

asyc = Λy  Vcrs+ as yt 2 − D(tgo,ωb,gir)asym t2 go  (5.14a) aszc = Λz  −Vcqs+a s zt 2 − D(tgo,ωb,tipp)aszm t2 go  . (5.14b)

(43)

5.2 Styrlagar 31

5.2.4

LQAPN

Linear Quadratic Augmented Proportional Navigation (LQAPN) ¨ar en modern styrlag som visat sig f¨ordelaktig i tidigare studier, till exempel [19] och [20]. En f¨oruts¨attning f¨or att anv¨anda denna typ av reglerstrategi ¨ar att man f¨orst be-skrivit systemet med en linj¨ar modell p˚a tillst˚andsform. D˚a missilens dynamik ¨

andras med avseende p˚a det relativa avst˚andet Rrel, relativa n¨armandehastigheten

Vc, samt missilens hastighet Vm s˚a ¨andras ¨aven modellen n¨ar man g˚ar fr˚an en

ber¨akningspunkt till en annan. Metoden f¨or att slippa ber¨akna en ny modell, och framf¨orallt en ny styrlag, online vid varje ber¨akningspunkt kallas parameterstyr-ning och g˚ar ut p˚a att man p˚a f¨orhand ber¨aknar styrlagar f¨or diskreta punkter och sedan interpolerar mellan dessa online. Man kan dock s¨aga sig veta Vm, varvid

problemet reduceras till tv˚a dimensioner. I detta arbete har dock denna metod inte anv¨ants utan en ny styrlag ber¨aknas ist¨allet online vid varje m¨atning. Detta g¨or att resultaten f¨or LQAPN blir lite b¨attre ¨an vad en approximation med para-meterstyrning skulle ge. En l¨osning med parapara-meterstyrning presenteras i [19]. I [19] approximeras m˚alets dynamik som ett f¨orsta ordningens system enligt

˙asyt = −ε · asyt, (5.15)

d¨ar ε kan ses som en designparameter och har valts i enlighet med [20] till

ε = 0.7. (5.16)

Tillst˚anden f¨or systemmodellen i girled utg¨ors av vektorn

x =              rs as ym ωz as yt              (5.17)

och insignalen ¨ar den kommenderade accelerationen u = as

yc. Via ekvation (3.11),

(5.9) och (5.15) erh˚alls ˙x = Ax + Bu =                2 VcR − 1 R 0 1 R 0 −τ1s Vτs 0 0 1 τsV (ω0τs(2ζ − ω0τs) − 1) 1 τs(1 − ω0τs2ζ) 0 0 0 0 −ε                x+              0 0 ω2 0τs V 0              u. (5.18) Tillst˚ands˚aterkopplingen

u = −Lx (5.19)

erh˚alls via klassisk LQ-teori enligt [9]. I detta arbete anv¨ands Matlab-kommandot lqr. Straffmatriserna i optimeringskriteriet v¨aljs i enlighet med de som f¨oreslogs i

(44)

[19] till Q =              1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0              (5.20a) R = 1, (5.20b)

d¨ar Q straffar avvikelser i tillst˚anden x och R straffar styrsignalsenergin i u. P˚a grund av symmetrin given i (3.13) f¨or tipp- och girled s˚a kommer tillst˚andsmodellen ¨

aven i tippled att ges av ekvation (5.18). F¨oljaktligen blir ¨aven tillst˚ands˚aterkopplingen i ekvation (5.19) densamma. Det blir dock vissa skillnader i tecken, men detta l¨oses genom att l˚ata tillst˚andsvektorn i tippled ges av

x =              −qs as zm −ωy as zt              . (5.21)

Anledningen till tecken¨andringen ¨ar att ett positivt ωy g¨or att missilens nos

rote-ras upp˚at, vilket i sin tur medf¨or en translation upp˚at. Eftersom z-axeln ¨ar riktad ned˚at ger detta ett ombytt tecken j¨amf¨ort med modellen i girled. Samma resone-mang g¨aller f¨or syftlinjesrotationen qs.

5.2.5

MPCAPN

Detta ¨ar en relativt obepr¨ovad styrlag som bygger p˚a teorin i kapitel 2. Den ben¨amns i detta arbete som Model Predictive Control Augmented Proportional Navigation (MPCAPN) och har tidigare studerats i [12], men d˚a under enkla-re former. F¨ordelen med en enkla-regulator som baseras p˚a MPC j¨amf¨ort med en som baseras p˚a LQ ¨ar att MPC explicit tar h¨ansyn till begr¨ansningarna p˚a styrsignalen. Systemet beskrivs precis som f¨or LQAPN av tillst˚andsmodellen i ekvation (5.18). ¨

Aven h¨ar anv¨ands samma modell f¨or gir- och tippled. Tillst˚andsvektorerna i gir-och tippled ¨ar samma som ges i (5.17) gir-och (5.21). D˚a MPC anv¨ander sig av ett diskret system beh¨over systemet samplas. Eftersom m¨atuppdateringarna fr˚an m˚alf¨oljefiltret sker med 100 Hz blir ett naturligt val av samplingsperioden

Ts = 1

100 = 0.01 sekunder. (5.22) F¨or detta anv¨ands Matlab-kommandot c2d med alternativet zero-order hold. Detta inneb¨ar att man ans¨atter insignalen u(t) som styckvis konstant mellan sam-pelpunkterna. F¨orfarandet f¨oljer i stort de resonemang om sampling av system

(45)

5.2 Styrlagar 33

som f¨ors i [7].

En missil kan inte accelerera obegr¨ansat. Detta resulterar i begr¨ansningar p˚a den kommenderade accelerationen, as

c. Denna begr¨ansning s¨atts i enlighet med [20] till

±500 m/s2. Vi f˚ar allts˚a en insignalbegr¨ansning enligt

ac =

( 500 ac > 500 ac |ac| ≤ 500

−500 ac < 500

(5.23) Om horisonterna Ny, Nu och Nc v¨aljs till

Ny = Nu = 30, (5.24a)

Nc = Nu− 1 = 29, (5.24b)

s˚a erh˚alls optimeringsproblemet min U∆={ut,ut+1,...,ut+29} n J(U , x) = xTt+30|tP xt+30|t + 29 X k=0 xTt+k|tQxt+k|t+ uTt+k|tRut+k|t o , (5.25) d˚a − 500 ≤ ut+k|t ≤ 500, k = 0, . . . , 29, xt|t = x(t), xt+k+1|t = Axt+k|t+ But+k|t, k ≥ 0.

Straffmatriserna Q och R v¨aljs till

Q =              1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0              (5.26a) R = 10−10. (5.26b)

Detta ger en betydligt aggressivare regulator ¨an d˚a straffen i (5.20) anv¨ands. Det-ta med motiveringen att en avvikelse i syftlinjesroDet-tationen helt enkelt regleras ut mycket snabbare utan att f¨or den sakens skull ge en f¨or stor ¨oversl¨ang - se Figur 5.2.

N¨ar missilen kommer allt f¨or n¨ara sitt m˚al blir dock det ¨oppna systemet i ekvation (5.18) instabilt, varvid det kan vara l¨ampligt med en mindre aggressiv regulator. Detta uppn˚as genom att v¨alja

R = 

10−10, n go> 20

(46)

0 0.2 0.4 0.6 0.8 1 1.2 −0.1 −0.05 0 0.05 0.1 0.15 0.2 MPC vs. LQ r s [rad/s] 0 0.2 0.4 0.6 0.8 1 1.2 −600 −400 −200 0 200 400 600 u [m/s 2] tid [s]

Figur 5.2.Illustration av hur ett initialt fel p˚a syftlinjesrotationen regleras ut d˚a inga st¨orningar f¨oreligger. Heldragen kurva anger MPCAPN (—) med straff enligt (5.26) me-dan streckad kurva anger LQAPN (- -) med straff enligt (5.20). Avst˚andet mellan m˚al och missil ¨ar Rrel = 1000 meter och n¨armandehastigheten ¨ar vald lika med missilens

hastighet Vc= Vm= Mach 2.5.

d¨ar ngo ¨ar antalet samplingspunkter fram till den tidpunkt d˚a m˚alet f¨orutsp˚as

tr¨affas och ber¨aknas enligt

ngo = ceil  Rrel Vc , Ts  . (5.28)

H¨ar ¨ar ceil ett Matlab-kommando som avrundar upp˚at till n¨armaste heltal och att ngo= 20 motsvarar tgo= 0.2 sekunder med samplingstident Ts= 0.01

sekun-der.

N¨ar missilen n¨armar sig m˚alet har det ¨aven visat sig effektivt att anv¨anda en prediktion- och styrsignalhorisont som str¨acker sig exakt fram till den tidpunkt d˚a m˚alet f¨orutsp˚as tr¨affas. Motiveringen till ett s˚adant val ¨ar att straffet p˚a en avvi-kelse vid predikterad tr¨aff ¨ar extra viktig att undertrycka och ska d¨arf¨or straffas h˚ardare. Detta straff ges d˚a av P , d.v.s. den station¨ara l¨osningen till Riccatiekva-tionen, vilket ¨ar en matris med v¨aldigt stora komponenter. En l¨amplig definition blir

Ny = Nu =



30, ngo≥ 30

ngo, ngo< 30. (5.29)

Straffmatrisen P och˚aterkopplingen K ber¨aknas enligt ekvation (2.5) som l¨osningen till den allm¨anna Riccattiekvationen. Detta svarar mot att efter Nusampel

(47)

predik-5.2 Styrlagar 35

teras styrsignalen ut+k som l¨osningen till LQ-problemet vilket beskrivs i avsnitt

5.2.4. Detta ger en stabil l¨osning f¨orutsatt att systemet under de Nu samplen har

hunnit styras till ett omr˚ade d¨ar inga begr¨ansningar sl˚as i. Eftersom missilen inte utg¨or ett tidsinvariant system ¨ar det dock v¨aldigt sv˚art att garantera stabilitet. Intressant ¨ar givetvis ocks˚a at se vad som h¨ander om man anv¨ander samma straff f¨or LQAPN som f¨or MPCAPN. I Figur 5.3 ses en j¨amf¨orelse mellan dessa tv˚a metoder d˚a man applicerar straffen i (5.26).

0 0.2 0.4 0.6 0.8 1 1.2 −0.1 −0.05 0 0.05 0.1 0.15 0.2 MPC vs. LQ r s [rad/s] 0 0.2 0.4 0.6 0.8 1 1.2 −600 −400 −200 0 200 400 600 u [m/s 2] tid [s]

Figur 5.3.Illustration av hur ett initialt fel p˚a syftlinjesrotationen regleras ut d˚a inga st¨orningar f¨oreligger. Heldragen kurva anger MPCAPN (—) medan streckad kurva anger LQAPN (- -). B˚ada med straff enligt (5.26). Avst˚andet mellan m˚al och missil ¨ar Rrel=

300 meter och n¨armandehastigheten ¨ar vald lika med missilens hastighet Vc = Vm =

Mach 2.5.

Om man har en st¨orre och tr¨ogre missil som kr¨aver mer roderutslag ¨an den som hittills behandlats blir skillnaden mellan MPCAPN och LQAPN ¨annu tydligare ¨an i Figur 5.3. En tr¨ogre missil f˚as genom att v¨alja l¨agre v¨arden p˚a CNα,trim och

CCβ,trim i (3.12). Om dessa skalas med en faktor 0.6 erh˚alls uppf¨orandet i Figur

(48)

0 0.2 0.4 0.6 0.8 1 1.2 −0.1 −0.05 0 0.05 0.1 0.15 0.2 MPC vs. LQ r s [rad/s] 0 0.2 0.4 0.6 0.8 1 1.2 −600 −400 −200 0 200 400 600 u [m/s 2] tid [s]

Figur 5.4.Illustration av hur ett initialt fel p˚a syftlinjesrotationen regleras ut d˚a inga st¨orningar f¨oreligger. Heldragen kurva anger MPCAPN (—) medan streckad kurva anger LQAPN (- -). B˚ada med straff enligt (5.26). Avst˚andet mellan m˚al och missil ¨ar Rrel=

300 meter och n¨armandehastigheten ¨ar vald lika med missilens hastighet Vc = Vm =

Mach 2.5. Koefficienterna CNα,trim och CCβ,trim ¨ar skalade med en faktor 0.6

5.2.6

Explicit MPCAPN

Som tidigare n¨amnts ¨ar den stora svagheten hos MPC tidsaspekten. Vid varje sampel g¨ors en onlineber¨akning som resulterar i en optimal styrlag ¨over en finit tidshorisont. F¨or att undvika detta kan metoden f¨or Explicit MPC anv¨andas, se avsnitt 2.4.

Systemet beskrivs ¨aven h¨ar av tillst˚andsmodellen i ekvation (5.18) och straffmatri-serna ges som i fallet MPCAPN av (5.26). Ett problem med Explicit Model Pre-dictive Control (EMPC) ¨ar att antalet regioner i mp-QP l¨osningen v¨axer snabbt, dels med avseende p˚a antalet tillst˚and i x, men framf¨orallt med avseende p˚a styr-signalhorisonten, Nu. I avsnitt 5.2.5 anv¨andes en styrsignalhorisont p˚a 30 sampel.

Ett motsvarande val h¨ar skulle medf¨ora en mp-QP l¨osning med tusentals omr˚aden. Detta skulle inneb¨ara en v¨aldigt l˚ang ber¨akningstid s˚av¨al offline som online, varvid hela po¨angen med en explicit l¨osning f¨orsvinner. Detta problem har l¨osts genom att ist¨allet f¨or att sampla systemet med Ts= 0.01 sekunder anv¨anda

(49)

5.2 Styrlagar 37

och

Ny = Nu = 3, (5.31a)

Nc = Nu− 1 = 2. (5.31b)

Man f˚ar p˚a detta s¨att en lika l˚ang prediktion tidsm¨assigt, men med betydligt l¨agre Nuoch Nc. Antalet omr˚aden i mp-QP l¨osningen kommer d˚a att ligga runt cirka 25

stycken. Observera att styrsignalen fortfarande ber¨aknas vid varje m¨atuppdatering fr˚an m˚alf¨oljefiltret, men att man i ber¨aknings¨ogonlicket s¨ager sig ha en predikterad styrsignal som ¨ar styckvis konstant under 0.1 sekunders intervall. Detta inneb¨ar gi-vetvis en ytterligare f¨ors¨amring, men har visat sig ge tillfredst¨allande resultat i de utf¨orda simuleringarna. En illustration av hur prediktionen g˚ar till ges i Figur 5.5.

0.1 0.2 0.3

0.01 tid [s]

u

Figur 5.5. Heldragen kurva (—) anger predikterad styrsignalsekvens vid tiden t = 0. Streckad kurva (- -) anger predikterad styrsignalsekvens vid tiden t = 0.01.

Precis som f¨or styrlagen MPCAPN ¨ar det ¨aven h¨ar l¨ampligt att ha en prediktion-och styrsignalorisont som str¨acker sig exakt fram till den tidpunkt d˚a m˚alet f¨orutsp˚as tr¨affas. En l¨amplig definition av dessa horisonter ges analogt med resonemanget kring (5.29) till

Ny = Nu =



3, ngo≥ 3

ngo, ngo< 3. (5.32)

Observera att denna ber¨akning g¨ors offline och baseras p˚a vilken arbetspunkt mp-QP l¨osningen skapas f¨or. Med arbetspunkt menas v¨ardet p˚a processvariablerna Rrel, Vc och Vm.

(50)

Parameterstyrning

Parameterstyrning (eng: Gain Scheduling) inneb¨ar att man har en linj¨ar regula-tor som ¨ar en funktion av m¨atbara processvariabler. I v˚art fall ¨ar dessa variabler Rrel, Vc och Vm. Grundtanken ¨ar att man ber¨aknar en m¨angd styrlagar offline i

diskreta arbetspunkter. Online s˚a interpolerar man sedan mellan n¨arliggande ar-betspunkter, varvid man erh˚aller en god approximation av den optimala styrlagen f¨or aktuellt flygtillst˚and. Eftersom man p˚a f¨orhand kan s¨aga sig veta missilens ungef¨arliga hastighet Vm, kan denna s¨attas fix. I detta arbete behandlas en missil

som h˚aller hastigheten

Vm = Mach 2.5 (5.33)

via reglering av dragkraften. Variablerna Rreloch Vcvarierar dock.

Interpolations-punkterna f¨or dessa har valts som

Rrel = 100, 200, 300, . . . , 2000 m, (5.34a)

Vc = 100, 200, 300, . . . , 3000 m/s. (5.34b)

I Figur 5.6 illustreras hur parameterstyrning genomf¨ors.

100 200 100 200 Förberäknade mp-QP lösningar Aktuellt flygtillstånd Vc V1 c V2 c R1 rel R2rel Rrel mpQP11 mpQP12 mpQP21 mpQP22 (Rrel, Vc)  Rrel = 320 m Vc= 370 m/s

Figur 5.6.Illustration ¨over parameterstyrning.

mp-QP l¨osningarna mpQP11, mpQP12, mpQP21 och mpQP22 inneh˚aller var f¨or sig omr˚aden liknande de i Figur 2.4, dock i fyra dimensioner eftersom dim(x) = 4.

(51)

5.2 Styrlagar 39

Utifr˚an dessa fyra n¨arliggande mp-QP l¨osningar ber¨aknas fyra separata styrlagar u11, u12, u21och u22som affina funktioner av det aktuella tillst˚andet x. Styrlagen u11erh˚alls t.ex. genom ber¨akning av den affina funktionen Fi

11x+ gi11, d¨ar index

i anger aktuellt omr˚ade i mp-QP l¨osningen f¨or denna punkt.

Beroende p˚a hur n¨ara en interpolationspunkt vi befinner oss ska styrlagen f¨or den-na punkt p˚averka resultatet olika mycket. Linj¨ar interpolation i tv˚a dimensioner sker i enlighet med tankes¨attet i [11] och resulterar i styrlagen

u(η, ε) = (1 − η) ·(1 − ε)u11+ εu12 + η · (1 − ε)u21+ εu22, (5.35)

d¨ar vikterna η och ε ges av

η = Rrel− R 1 rel R2 rel− R1rel , (5.36a) ε = Vc− V 1 c V2 c − Vc1 . (5.36b) Ber¨akningstid

Syftet med Explicit MPC ¨ar att minska ber¨akningstiden j¨amf¨ort med d˚a traditio-nell MPC anv¨ands. Att detta har lyckats kan ses i Tabell 5.1. H¨ar redovisas en genomsnittlig ber¨akningstid per m¨atpunkt f¨or MPC och Explicit MPC under en hel simulering.

Styrlag Ber¨akningstid [s] MPCAPN 0.0340

EMPCAPN 0.0080

Tabell 5.1.Genomsnittlig ber¨akningstid per m¨atpunkt f¨or guidancedelen under en si-mulering.

Observera att denna tid endast avser ber¨akning av styrlagen och ej skattning av m˚aldata.

Man skulle kunna t¨anka sig att tidsskillnaden mestadels h¨arr¨or fr˚an att MPCAPN anv¨ander sig av en styrsignalhorisont med fler sampel ¨an Explicit MPCAPN. Detta ¨ar dock inte fallet vilket visas i Tabell 5.2. H¨ar baseras MPCAPN p˚a en samp-lingstid samt horisonter valda enligt (5.30) och (5.31). Det vill s¨aga samma som f¨or Explicit MPCAPN.

Styrlag Ber¨akningstid [s] MPCAPN 0.0268

Tabell 5.2.Genomsnittlig ber¨akningstid per m¨atpunkt f¨or guidancedelen under en si-mulering. Samplingstid f¨or regulatorn samt horisonter valda enligt (5.30) och (5.31)

(52)

Anledningen att den explicita l¨osningen inte ¨ar ¨annu snabbare ¨ar att parameter-styrning anv¨ands. Eftersom man interpolerar mellan fyra olika styrlagar vid varje m¨atpunkt beh¨over f¨oljaktligen ocks˚a fyra stycken mp-QP l¨osningar analyseras f¨or att finna dessa styrlagar.

En annan f¨orenkling som ¨ar gjord ¨ar att missilen alltid befinner sig p˚a h¨ojden 3000 m och flyger med en hastighet av Mach 2.5. Den sistn¨amnda kommer i och f¨or sig inte att variera s˚a mycket d˚a denna hastighet styrs av en separat regler-krets mot just detta v¨arde. H¨ojden missilen kommer att flyga p˚a ¨ar ju dock sv˚ar att veta p˚a f¨orhand. En t¨ankbar l¨osning till problemet ¨ar att inf¨ora h¨ojden som en ytterligare parameter i parameterstyrningen och d˚a f˚a ett tredimensionellt sy-stem. Nackdelen med detta ¨ar att man f¨orlorar i ber¨akningstid samt att mp-QP l¨osningen kommer att kr¨ava betydligt mer lagringskapacitet.

5.2.7

Koordinattransformationer

De styrlagar som har presenterats i detta kapitel resulterar i kommenderade accele-rationer som ¨ar vinkelr¨ata mot syftlinjen. Autopiloten vill dock ha kommenderade accelerationer i det kroppsfasta koordinatsystemet. Denna transformation g¨ors ge-nom det f¨orenklade sambandet

abyc = as yc cos ν1, (5.37a) abzc = as zc cos ν2 , (5.37b)

(53)

Kapitel 6

Simuleringar

Styrlagarna som presenterades i kapitel 5 har j¨amf¨orts enligt tre olika metoder. Dessa ¨ar Monte-Carlo simuleringar, avsnitt 6.2, h¨andelsestyrda simuleringar, av-snitt 6.3, samt skjutzoner, avav-snitt 6.4. De flygscenarier som behandlas vid Monte-Carlo simuleringar samt vid skjutzoner beskrivs i avsnitt 6.1. H¨andelsestyrda si-muleringar beskrivs i sin helhet i avsnitt 6.3.

6.1

Scenarier

6.1.1

Scenario 1

I detta skjutscenario startar missilen p˚a h¨ojden 3000 m. M˚alet befinner sig p˚a samma h¨ojd och avst˚andet dem emellan ¨ar 18 km. M˚alet flyger till en b¨orjan med hastigheten Mach 0.9 i riktning rakt mot missilen. Efter 4 sekunder g¨or det en 4g sv¨ang till fr˚ankurs, samt accelererar med 1.5g i xbt-led efter 10 sekunder in i

sv¨angen.

6.1.2

Scenario 2

Detta scenario liknar till stora delar scenario 1. Skillnaderna ¨ar att m˚alet p˚ab¨orjar sin sv¨ang efter 6 sekunder och utf¨or denna med 8g, samt att accelerationen i xbt

-led p˚ab¨orjas efter 6 sekunder in i sv¨angen. Detta g¨or att m˚alet hinner v¨anda innan tr¨aff, varvid tr¨affen sker rakt bakifr˚an.

6.1.3

Scenario 3

Detta ¨ar det sv˚araste av de tre scenarierna. M˚alet g¨or h¨ar en s˚a kallad tunnelroll, vilket inneb¨ar att det hela tiden utf¨or en kraftig roterande man¨over i y- och z-led. Detta g¨or vinkelm¨atningen mycket sv˚ar. Starth¨ojden ¨ar 3 km och hastigheten ¨ar Mach 0.9.

References

Related documents

[r]

Utbytesalgoritmen anv¨ ands f¨ or att ber¨ akna en approximation till en konvex funktion f ∈ C[a, b] ur m¨ angden P 1 , dvs.. ur m¨ angden av f¨ orstagradspolynom p˚

På in- kom stsidan har av detta belopp observerats 225.600 mark såsom statsan- slag för skattfinansiell utjämning medan såsom övriga inkomstposter upp- tagits

reparat ions-, elektricitets-, husbyggnads- och träbearbetnings-, söm- nads- och näringsekonomiavdelningar. Vid skolan bör efter behov anordnas undervisning i form. av

Här finns allt ifrån lättåkta nybörjarböcker till riktigt branta backar för den som är van skidåkare och vill ha utmaningar.. Vid foten av skidanläggningen finns restauranger

(b) Ber¨ akna den betingade sannolikheten att komponent C inte funkar givet att str¨ om kan passera genom systemet fr˚ an v¨ anster till h¨ oger..

[Tips: Faktorisera polyno-

Endast definitioner och trigonometriska r¨ aknelagar f˚ ar anv¨ andas utan att de f¨ orst bevisas. Sida 2