• No results found

Tidsvariabla system och robust styrning

N/A
N/A
Protected

Academic year: 2021

Share "Tidsvariabla system och robust styrning"

Copied!
88
0
0

Loading.... (view fulltext now)

Full text

(1)

Examensarbete utf¨ort i Reglerteknik vid Tekniska H¨ogskolan i Link¨oping

av

Daniel Hellman Reg nr: LiTH-ISY-EX-3468-2004

(2)
(3)

Examensarbete utf¨ort i Reglerteknik vid Tekniska H¨ogskolan i Link¨oping

av

Daniel Hellman Reg nr: LiTH-ISY-EX-3468-2004

Handledare: Ola Berger, Ragnar Wallin Examinator: Anders Hansson

(4)

Avdelning, Institution Division, Department

Institutionen för systemteknik

581 83 LINKÖPING

Datum Date 2004-06-04 Språk

Language Rapporttyp Report category ISBN X Svenska/Swedish

Engelska/English Licentiatavhandling X Examensarbete ISRN LITH-ISY-EX-3468-2004

C-uppsats

D-uppsats Serietitel och serienummer Title of series, numbering ISSN

Övrig rapport

____

URL för elektronisk version

http://www.ep.liu.se/exjobb/isy/2004/3468/ Titel

Title Tidsvariabla system och robust styrning Time-varying systems and robust control Författare

Author Daniel Hellman

Sammanfattning Abstract

Dynamiken för en starkt accelerande robot har modellerats. Modellen linjäriseras så att roboten beskrivs som ett linjärt tidsvariabelt system. Denna representation beskriver roboten väl då robotens anblåsningsvinkel, vilket är vinkeln mellan robotkroppen och robotens hastighet, är liten. Eftersom det ej är möjligt att mäta alla robotens tillstånd har en observatör tagits fram i form av ett Kalmanfilter. Problematik vid framtagandet av observatören diskuteras i rapporten. Den linjära tidsvariabla modellen har använts till att ta fram två regulatorer. En LQ-regulator och en H-infinity-regulator. Hur dessa tas fram och vilka problem som finns diskuteras i rapporten. För att kunna se fördelar och nackdelar beträffande prestanda och robusthet har en mängd tester gjort. Testerna visar på olika fördelar hos de olika reglersystemen. Till exempel är det lättare att få bra prestanda med LQ-regulatorn än H-infinity-regulatorn om systemet som styrs stämmer bra överens med systemet som använts vid reglerdesignen. H_infinity-regulatorn har bättre förmåga att anpassa sig till modellförändringar givet att observatören gör bra skattningar. Det är dock svårt att utnämna en generell vinnare.

Nyckelord Keyword

(5)
(6)

Sammanfattning

Dynamiken f¨or en starkt accelerande robot har modellerats. Modellen linj¨ariseras s˚a att roboten beskrivs som ett linj¨art tidsvariabelt system. Denna representation beskriver roboten v¨al d˚a robotens anbl˚asningsvinkel, vilket ¨ar vinkeln mellan ro-botkroppen och robotens hastighet, ¨ar liten. Eftersom det ej ¨ar m¨ojligt att m¨ata alla robotens tillst˚and har en observat¨or tagits fram i form av ett Kalmanfilter. Problematik vid framtagandet av observat¨oren diskuteras i rapporten. Den linj¨ara tidsvariabla modellen har anv¨ants till att ta fram tv˚a regulatorer. En LQ-regulator

och en H∞-regulator. Hur dessa tas fram och vilka problem som finns diskuteras

i rapporten. F¨or att kunna se f¨ordelar och nackdelar betr¨affande prestanda och robusthet har en m¨angd tester gjort. Testerna visar p˚a olika f¨ordelar hos de olika reglersystemen. Till exempel ¨ar det l¨attare att f˚a bra prestanda med LQ-regulatorn

¨an H∞-regulatorn om systemet som styrs st¨ammer bra ¨overens med systemet som

anv¨ants vid reglerdesignen. H∞-regulatorn har b¨attre f¨orm˚aga att anpassa sig till

modellf¨or¨andringar givet att observat¨oren g¨or bra skattningar. Det ¨ar dock sv˚art att utn¨amna en generell vinnare.

Keywords: time-varying, Kalman, LQ, H-infinity

(7)
(8)

Tackord

Jag vill tacka SAAB Bofors Dynamics AB som gett mig m¨ojligheten att g¨ora mitt examensarbete ute i industrin. Ett stort tack till min handledare Ola Berger f¨or hans goda r˚ad och ideer. Ett stort tack ¨aven till min handledare Ragnar Wallin f¨or hans hj¨alpande r˚ad betr¨affande teori och LaTeX. Jag vill ¨aven tacka min familj f¨or det ovillkorliga st¨od jag alltid f˚ar.

(9)
(10)

Inneh˚

all

1 Inledning 1 2 Reglerobjekt 3 2.1 R¨orelseekvationer . . . 3 2.2 Aerodynamik . . . 6 2.3 Systemst¨orningar fr˚an motor . . . 6 2.4 Ovriga systemst¨orningar . . . .¨ 6 2.5 M¨atgivare . . . 6 2.6 Tillst˚andsbeskrivning . . . 7 3 Teori 9 3.1 Linj¨ara system p˚a tillst˚andsform . . . 9

3.2 Observerbarhet och styrbarhet . . . 9

3.3 Tidskontinuerligt Kalmanfilter . . . 10 3.4 Styrprinciper . . . 11 3.4.1 Linj¨arkvadratisk reglering . . . 11 3.4.2 H∞-reglering . . . 12 4 Reglerdesign 15 4.1 Observat¨or . . . 15

4.1.1 Inf¨orande av en extra accelerometer . . . 18

4.1.2 Variabelbyte f¨or ¨okad observerbarhet . . . 18

4.2 Slutsatser kring observat¨or . . . 18

4.3 Styrning med LQG . . . 19

4.3.1 Styrning med konstanta straffmatriser . . . 20

4.3.2 Styrning med tidsvariabla straffmatriser . . . 23

4.4 Slutsatser kring LQ-styrning . . . 24

4.5 Styrning med H∞ . . . 25

4.5.1 Diskussion kring viktfunktioner . . . 26

4.5.2 Parametrarnas betydelse . . . 27

4.5.3 H∞med parameterstyrning och tidsvariabelt system . . . . 28

4.5.4 Tre f¨ors¨ok till sv¨angningsreducering . . . 32

4.5.5 Reglerstrategibyte f¨or H∞ . . . 34

(11)

4.6 Slutsatser kring H∞-regulatorn . . . 35

5 J¨amf¨orelse mellan reglermetoder 37 5.1 F¨orklaring och diskussion kring testutf¨orande . . . 37

5.2 Beskrivning av tester . . . 38

5.3 Prestandatester utan observat¨or . . . 39

5.3.1 Referensf¨oljningstest utan dysfel . . . 39

5.3.2 Dysfelstest med referenssignal noll . . . 39

5.3.3 Referensf¨oljningstest med dysfel . . . 40

5.4 Slutsatser kring prestandatester utan observat¨or . . . 41

5.5 Prestandatester med observat¨or . . . 41

5.5.1 Referensf¨oljningstest utan dysfel . . . 41

5.5.2 Dysfelstest med referenssignal noll . . . 42

5.5.3 Referensf¨oljningstest med dysfel . . . 42

5.6 Slutsatser kring observat¨orens effekter p˚a prestandan . . . 43

5.7 Robusthetstester utan observat¨or . . . 43

5.7.1 Inf¨orande av styrsignalbegr¨ansningar . . . 44

5.7.2 Slutsatser kring styrsignalbegr¨ansning . . . 47

5.7.3 Inf¨orande av olinj¨ar aerodynamik . . . 48

5.7.4 Slutsatser kring inf¨orande av olinj¨ar aerodynamik . . . 51

5.8 Robusthetstester med olinj¨ar aerodynamik och observat¨or . . . 51

5.8.1 Referensf¨oljning utan dysfel med olinj¨ar aerodynamik . . . . 51

5.8.2 Dysfelstest med olinj¨ar aerodynamik . . . 52

5.8.3 Referensf¨oljning med dysfel och olinj¨ar aerodynamik . . . 52

5.9 Slutsatser kring inf¨orandet av observat¨or . . . 53

5.10 Slutsimulering med olinj¨ar aerodynamik, observat¨or och styrsignal-begr¨ansning . . . 53

5.11 Slutsatser kring j¨amf¨orelse mellan reglermetoder . . . 54

A Tillst˚andsmodellen 59 A.1 Definitioner och f¨orenklingar . . . 59

A.2 R¨orelseekvationer . . . 60 A.3 M¨atsignaler . . . 60 A.3.1 Accelerometer . . . 60 A.3.2 Rategyro . . . 61 A.4 Systemmatriser . . . 61 A.5 St¨orningsmatriser . . . 63 B Analytiska metoder 65 B.1 F¨ors¨ok att f˚a tillst˚andsekvationen tidsinvariant genom en linj¨ar till-str˚andstransfomation . . . 65

B.2 Slutsatser kring algebraisk tillst˚andstransformation . . . 67

B.3 Att skapa ett tidsinvariant slutet system med hj¨alp av en tidsvaribel ˚aterkoppling . . . 67

(12)

Inneh˚all vii

B.5 Att skapa ett tidsinvariant system genom val av tillst˚and . . . 68 B.6 Slutsatser kring analytiska metoder . . . 68

C Variabelbyte f¨or ¨okad observerbarhet och skapande av

(13)
(14)

Kapitel 1

Inledning

Detta examensarbete ¨ar utf¨ort p˚a SAAB Bofors Dynmics AB. SAAB Bofors

Dyna-mics AB ¨ar en del av SAAB koncernen som utvecklar och producerar vapensystem. SAAB oms¨atter ungef¨ar sjutton miljarder per ˚ar, d¨ar utvecklingen st˚ar f¨or tjugo procent. Huvuddelen av utvecklingen ¨ar stationerad i Sverige.

F¨or att kunna f¨orsvara sig mot snabba m˚al som ¨ar sv˚ara att uppt¨acka kr¨avs det v¨aldigt snabba missiler och korta reaktionstider. Dessa kallas f¨or HVM:er (Hyper velocity Missile). F¨or n¨arvarande finns det ingen utvecklad HVM i drift.

Studier f¨or att ta fram HVM:er visar p˚a vikten att styra roboten under acce-lerationsfasen. L˚angsammare robotar accelereras inte lika kraftig och uppn˚ar inte samma hastigheter som en HVM. Dessa robotar brukar heller inte beh¨ova styras under den inledande accelerationsfasen, utan de b¨orjar styras s˚a fort boostfasen ¨ar ¨over. Den kraftiga acceleration en HVM uts¨atts f¨or i startfasen leder till att has-tigheten ¨andras snabbt och med den ¨andras de aerodynamiska f¨oruts¨attningarna. I robotens startfas anv¨ands en raketmotor som brinner snabbt, vilket inneb¨ar att

robotens masscentrum och tr¨oghetsmoment ¨andras snabbt. P˚a grund av att

dyna-miken f¨or¨andras med tiden brukar roboten beskrivas som ett tidsvariabelt system. Motorns drivkraft ¨ar s¨allan optimal vad g¨aller riktning och angreppspunkt. Detta ger upphov till krafter och moment p˚a roboten som m˚aste regleras bort. Tidigare

studier med LQ-regulatorer har gjorts att styra l˚angsammare robotar med goda

resultat. Mer konventionella robotar styrs dels med LQ-regulatorer, men ocks˚a

med mer klassiska metoder f¨or filterdesign. Det ¨ar av intresse att j¨amf¨ora robusta reglermetoder med LQ-reglering f¨or att se om b¨attre resultat kan uppn˚as.

Saab Bofors Dynamics h˚aller f¨or n¨arvarande p˚a med en studie p˚a HVM:er, d¨ar

skarpa provskjutningar ska g¨oras. Examensarbetet kommer dock ej direkt p˚averka

denna studie i dess nuvarande skede.

Teorin f¨or linj¨ara tidsinvarianta system (LTI) ¨ar betydligt mer utvecklad ¨an den f¨or linj¨ara tidsvariabla system och d¨arf¨or vore en omskrivning av ett linj¨art tidsbe-roende system till ett LTI-system ¨onskv¨art. F¨or att kunna g¨ora detta m˚aste n˚agon form av tidsvariabel transformation eller ˚aterkoppling g¨oras. Om detta ¨ar m¨ojligt och vilka krav detta st¨aller p˚a systemet ¨ar intressant att studera. I bilaga B ¨ar de

(15)

resultat som uppn˚atts presenterade. Det visar sig att vissa typer av tidsvariabla system kan transformeras eller ˚aterkopplas till tidinvarianta system, men det ¨ar ej m¨ojligt p˚a de robotmodeller som anv¨ands.

Syftet med examensarbetet ¨ar dels att se vilka m¨ojligheter det finns att med analytiska metoder eliminera tidsberoendet hos ett tidsvariabelt system, samt att j¨amf¨ora LQ-tekniken men en nyare reglermetod f¨or att se om b¨attre resultat kan uppn˚as.

Utredningen utg¨or ett examensarbete vid Link¨opings Tekniska H¨ogskola.

(16)

Kapitel 2

Reglerobjekt

Objektet som ska regleras ¨ar en kraftigt accelererande robot. F¨or att kunna anv¨anda modellbaserade reglerdesignmetoder m˚aste en modell tas fram. I detta kapitel be-skrivs kortfattad hur detta ¨ar gjort.

2.1

orelseekvationer

Robotmodellen ¨ar n˚agot f¨orenklad. Roboten r¨or sig i ett plan och har ingen rotation kring sin egen axel, se figur 2.1 Krafterna som p˚averkar roboten ¨ar drivkraften F, luftmotst˚andet T, lyftkraft fr˚an fenor och robotkropp N och kraft p˚a grund av roderutslag Nδ[4]. Alla storheter med tillh¨orande enheter ses i tabell 2.1. Robotens

r¨orelser beskrivs av nedanst˚aende differentialekvationer h¨amtade fr˚an mekaniken [8] ˙p =XF (2.1) d dt  I ˙θ=XM (2.2) I tangentialled f˚as fr˚an ekvation 2.1 ˙pT = ˙mTvT+ mT˙vT = −|T | cos(α) − (|N | + |Nδ|) sin(α)

Den f¨orsta termen ges av ˙

mTvT = −|F | cos(α)

Detta resulterar i tangentialaccelerationen aT = ˙vT =

(F − T ) cos(α) − (|N | + |Nδ|) sin(α)

mT

R¨orelseekvationen i hastighetsvektorns normalriktning f˚as genom en geometrisk

beskrivning, se figur 2.2, och ekvation 2.1. Den geometriska beskrivningen ger ett samband mellan accelerationen i normalled och banvinkelhastigheten.

(17)

F

N

d

N

T

δ

d

0 d

v

α

γ θ

δ

Figur 2.1.Figur Robot med hastighetsvektor, krafter och interna avst˚and

γ

v

0

+

v

v

v

0

Figur 2.2.Hastighetsvektorer vid olika tidpunkter

aN = lim ∆t→0 (v0+ ∆v) sin(α) ∆t = (v0+ ∆v) ˙γ lim ∆t→0∆v = 0 ⇒ aN = v0˙γ

(18)

2.1 R¨orelseekvationer 5 F drivkraft [N ] T luftmotst˚and [N ] N lyftkraft [N ] δ rodervinkel [rad] Nδ roderkraft [N ] m massa [kg] I tr¨oghetsmoment [kgm2] Mθ˙ visk¨os d¨ampning [N m] v tangentiell hastighet [m/s]

α anbl˚asningsvinkel [rad]

θ tippvinkel [rad]

γ banvinkel [rad]

dδ styrmomentarm [m]

d0 stabilitetsmarginal [m]

xref referensl¨angd fr˚an nos [m]

xmc masscentrum [m]

xpc tryckcentrum [m]

Tabell 2.1.Beteckningar

Genom att anv¨anda ekvation 2.1 f˚ar vi differentialekvtionen ˙pN = ˙mNvN + mN˙vN = −|T | sin(α) + (|N | + |Nδ|) cos(α)

Drivkraften uppkommer genom att massa kastas ut fr˚an boostmotorn enligt

˙

mNvN = −|Ftot| sin(α)

Tv¨arsaccelerationen blir d¨armed aN = ˙vN =

(F − T ) sin(α) + (|N | + |Nδ|) cos(α)

mN

(2.3) Ekvation 2.2 ger r¨orelseekvationen kring masscentrum relativt ett jordfast referens-system

d

dt(Iz˙θ) = ˙Iz˙θ + Izθ =¨ X

r · F + |Mθ˙|

Mθ˙ ¨ar visk¨os d¨ampning och beskrivs nedan i tabell 2.2. Eftersom dragkraften F

och friktionskraften T inte har n˚agon koponent ortogonalt mot en axel genom

masscentrum kommer de inte att ge n˚agot momentbidrag. Detta resulterar i

X

r · F = −|N |d0− |Nδ|dδ

Ekvationen f¨or robotens rotationsr¨orelse blir s˚aledes ¨

θ = −|N |d0− |Nδ|dδ+ |Mθ˙− ˙Iz˙θ

Iz

(19)

2.2

Aerodynamik

Roboten p˚averkas bland annat av krafter fr˚an omgivande luft. Fr˚an aerodynami-ken [4] f˚as konventionerna i tabell 2.2.

ρ luftt¨athet [kg/m3] d referensl¨angd [m] q = ρv2 dynamiskt tryck [N/m2] S = πd42 referensarea [m2] T = qSCT luftmotst˚and [N ] N = qSCN lyftkraft [N ] Nδ = qSCNδδ kraft fr˚an roder [N ] Mθ˙ = qSd 2 2vCmq˙θ visk¨os d¨ampning [N m]

Tabell 2.2.Aerodynamiska beteckningar

2.3

Systemst¨

orningar fr˚

an motor

En boostmotor av raketmotortyp har s¨allan en perfekt riktad drivbkraft. Dess-utom ¨ar kraftens angreppspunkt ofta inte centrerad i robotens l¨angsg˚aende axel. Dessa b¨agge st¨orningar kallas dysfel och m˚aste modelleras. En felriktad drivkraft ger upphov till tv˚a kraftkomponenter. Den ena ¨ar riktad parallellt med robotens l¨angsg˚aende axel och den andra ¨ar riktad tv¨ars robotens symmetriaxel, se figur 2.3. En tv¨arsriktat kraft ger upphov b˚ade till en kraft i normalled och ett moment och kommer s˚aledes in i b˚ade ekvation 2.1 och 2.2. Att drivkraften har fel angrepps-punkt resulterar bara i ett momentbidrag. Momentets storlek ¨ar drivkraftens bidrag parallellt med robotkroppen g˚anger avvikelsen fr˚an robotkroppens symmetriaxel,

se figur 2.4. St¨orande tv¨arskraft och moment kommer att betecknas Fd och Md.

Hur dessa kommer in i tillst˚andsbeskrivningen beskrivs i bilaga A.

2.4

Ovriga systemst¨

¨

orningar

St¨orningar fr˚an vindar som bl˚aser tv¨ars roboten ing˚ar i modellen. Tv¨arsvindarna ger upphov till ett extra bidrag hos anbl˚asningsvinkeln och kommmer att betraktas som en ok¨and insignal som ej kan p˚averkas. Hur tv¨arsvinden kommer in i ekvatio-nerna ¨ar n¨armare beskrivet i bilaga A.

2.5

atgivare

De m¨atgivare som anv¨ands ¨ar accelerometrar och rategyron. En accelerometer m¨ater accelerationen i en best¨amd riktning och ett rategyro m¨ater robotens rota-tionshastighet relativt ett fast referenssystem. B˚ade accelerometrar och rategyron p˚averkas av m¨atbrus. M¨atgivarna beskrivs vidare i bilaga A.

(20)

2.6 Tillst˚andsbeskrivning 7 tot

F

F

d

F

Figur 2.3.Drivkraft med komponenter vid felriktad drivkraft

2.6

Tillst˚

andsbeskrivning

De differentialekvationer som tagits fram ovan ¨ar olinj¨ara. F¨or att kunna ta fram observat¨orer och regulatorer, med de metoder som anv¨ands i rapporten, kr¨avs det en linj¨ar tillst˚andsmodell. Framtagning av en linj¨ar tillst˚andsmodell fr˚an de olinj¨ara ekvationerna g¨ors i bilaga A.

(21)

d

r

F

(22)

Kapitel 3

Teori

I detta kapitel beskrivs den teori som anv¨ands vid framtagandet av regulatorer f¨or roboten.

3.1

Linj¨

ara system p˚

a tillst˚

andsform

Linj¨ara system kan skrivas p˚a tillst˚andsform som ˙x(t) = A(t)x(t) + B(t)u(t)

y(t) = C(t)x(t) + D(t)u(t) (3.1)

Ett viktigt specialfall ¨ar linj¨ara tidsinvarianta (LTI) system d¨ar matriserna A, B, C och D ¨ar oberoende av tiden. Ofta vill man anv¨anda linj¨ara system d¨arf¨or att teorin f¨or dessa ¨ar v¨al utvecklad. Verkliga system ¨ar dock ofta b˚ade olinj¨ara och tidsberoende. Den robot som ska studeras har kraftiga motorer som f¨orbr¨anner krutet hastigt. R¨orelseekvationerna ¨ar olinj¨ara. Man kan dock f˚a ett linj¨art system genom att linj¨arisera. Systemets parametrar har ett snabbare tidsberoende ¨an de intressanta signalerna s˚a systemet kan inte betraktas som kvasistation¨art. En LTI-approximation kan d¨arf¨or inte anv¨andas f¨or hela avfyrningsf¨orloppet. Antingen f˚ar

man approximera systemet med en linj¨ar tidsvarierande tillst˚andsrepresentation

enligt (3.1) eller s˚a f˚ar man anv¨anda olika LTI-approximationer i olika tidsintervall. Att l¨osa tillst˚andsekvationen analytisk ¨ar ofta sv˚art. Komplexitetsgraden ¨okar snabbt med modellens storlek. I praktiska till¨ampningar ¨ar det d¨arf¨or vanligt att g¨ora en numerisk l¨osning.

3.2

Observerbarhet och styrbarhet

Tv˚a viktiga begrepp ¨ar styrbarhet och observerbarhet. F¨or LTI-system definieras styrbarhet och observerbarhet enligt nedan [6].

(23)

Styrbarhet En tillst˚andsvektor x s¨ags vara styrbar om det finns en insignal som f¨or tillst˚andet fr˚an origo till x p˚a ¨andlig tid. Ett system s¨ags vara styrbart om alla tillst˚andsvektorer ¨ar styrbara.

Observerbarhet En tillst˚andsvektor x 6= 0 s¨ags vara icke observerbar om

ut-signalen ¨ar identiskt noll d˚a initialv¨ardet ¨ar x och insignalen ¨ar identiskt noll. Systemet s¨ags vara observerbart om det saknar icke observerbara till-st˚andsvektorer.

De styrbara tillst˚anden f¨or ett LTI-system sp¨anns av kolumnerna i styrbarhetsma-trisen

S=B AB A2B . . . An−1B

d¨ar n ¨ar systemets ordningstal. Systemet ¨ar allts˚a styrbart precis d˚a S har full rang. De icke observerbara tillst˚anden f¨or ett LTI-system utg¨ors av nollrummet till observerbarhetsmatrisen O=        C CA CA2 .. . CAn−1       

Systemet ¨ar allts˚a observarbart precis d˚a O har full rang. Begreppen styrbarhet och observerbarhet dyker upp igen i kapitel 4 d˚a skattning av robotens tillst˚and diskuteras.

3.3

Tidskontinuerligt Kalmanfilter

Vid regleringen av roboten kommer inte alla tillst˚and att m¨atas. Vissa tillst˚and m˚aste d¨arf¨or skattas. F¨or detta ¨andam˚al kommer tidskontinuerliga Kalmanfilter att ber¨aknas. Ett Kalmanfilter kommer att beh¨ovas f¨or varje linj¨ar modell som anv¨ands f¨or att approximera robotens uppf¨orande.

F¨or ett linj¨art system ¨ar Kalmanfiltret optimalt f¨or skattning av tillst˚and om st¨orningarna ¨ar normalf¨ordelade [5]. Har st¨orningarna en annan f¨ordelning ¨ar Kal-manfiltret det optimala linj¨ara filtret. Ett system ¨ar beskrivet p˚a tillst˚andsform enligt ˙x(t) = A(t)x(t) + B(t)u(t) + N (t)ν1(t) y(t) = C(t)x(t) + D(t)u(t) + ν2(t) E(νk) = 0, k = 1, 2 Eν1 ν2  νT 1 ν2T   = R1 R12 RT 12 R2 

(24)

3.4 Styrprinciper 11

d¨ar E(•) ¨ar v¨antev¨ardet f¨or •. Kalmanfiltret som minimerar kovariansen avskatt-ningsfelet ˜x = x(t) − ˆx(t) ges av ˙ˆx(t) = [A(t) − K(t)C(t)] ˆx(t) + B(t)u(t) ˆ y(t) = C(t)ˆx(t) + D(t)u(t) d¨ar K(t) =[P (t)CT(t) + N (t)R 12]R −1 2 ˙ P (t) =A(t)P (t) + P (t)ATP (t) − P (t)CT(t) + N (t)R 12 R−12 P (t)CT(t) + N (t)R12 T + N (t)R1NT(t) P (t0) =E ˜x(t0)˜xT(t0) = P0

3.4

Styrprinciper

Tv˚a styrprinciper provas p˚a roboten. Den f¨orsta ¨ar linj¨arkvadratisk (LQ) reglering och den andra ¨ar H∞-reglering. En l¨attare genomg˚ang av stryrprinciperna ges i

detta kapitel.

3.4.1

Linj¨

arkvadratisk reglering

Styrlagen f¨or LQ-reglering f˚as genom att ett optimeringsproblem med kvadratisk

kostnadsfunktion l¨oses [1]. Optimeringsproblemet ser ut som min v(t1) = zT(t1)Q0(t)z(t1) + Z t1 t0 zT(t)Q 1(t)z(t) + uT(t)Q2(t)u(t) dt (3.2)

s.a. ˙x(t) = A(t)x(t) + B(t)u(t) + N (t)ν1(t) (3.3)

z(t) = M (t)x(t) (3.4)

y(t) = C(t)x(t) + D(t)u(t) + ν2(t) (3.5)

Olika val av Q1, Q2och Q0ger olika l¨osningar. Q1anv¨ands f¨or att straffa tillst˚and,

Q2 anv¨ands f¨or att straffa styrsignaler och Q0 anv¨ands f¨or att straffa sluttillst˚and.

Det g˚ar ¨aven att straffa kombinationer av tillst˚and och styrsignaler och d˚a anv¨ands

en Q12-matris. Vid regleringen av roboten har ingen s˚adan matris anv¨ants. Om

LQ-regulatorn anv¨ands tillsammans med ett Kalmanfilter kallas tekniken LQG. F¨or linj¨ara system g¨aller det att regulatorn och Kalmanfiltret, som var f¨or sig ¨ar optimala, kan ber¨aknas separat och ¨aven tillsammans bli optimala. Detta kallas separationssatsen [7]. Den optimala styrlagen, d˚a tillst˚anden skattas med Kalman-filtret, ges av

u(t) = −Q−1

(25)

och S(t) ¨ar l¨osningen till Riccatiekvationen

− ˙S(t) = AT(t)S(t) + S(t)A(t) + MT(t)Q1(t)M (t) − S(t)B(t)Q−21BT(t)S(t)

med slutvillkoret S(t1) = Q0, d¨ar t1 ¨ar sluttiden.

3.4.2

H

-reglering

H∞ ¨ar en s˚a kallad robust reglermetod. Detta betyder att den framtagna

regu-latorn ska fungera trots att det finns os¨akerheter i systemet. Regulatordesignen g¨ors genom att man v¨aljer vikter i frekvensplanet som ska garantera att vissa ¨overf¨oringsfunktioner f˚ar en viss form. De ¨overf¨oringsfunktioner som ¨ar viktiga be-skrivs i detta kapitel. Hur vikter f¨or ¨overf¨oringsfunktionerna v¨aljs och hur styrlagen ber¨aknas g˚as igenom nedan. Som parentes kan n¨amnas att det ¨aven finns H∞-teori

som hanterar tidsvariabla system. Denna kunskap var ej k¨and hos f¨orfattaren d˚a

arbetet genomf¨ordes och har ej tagits h¨ansyn till i rapporten. F¨or den intresserade kan mer information f˚as i [2].

Viktiga ¨overf¨oringsfunktioner i ett LTI-system

LTI-systemet i figur 3.1 har referenssignalen r, st¨orningen p˚a ing˚angen wu, m¨atst¨orningen

w

n

r

G(s)

-F

y

(s)

F

r

(s)

u

z

w

n

y

Figur 3.1.Blockschema f¨or ett ˚aterkopplat system

n och utsignalsst¨orningen w. ¨Overf¨oringsfunktionerna fr˚an insignalerna till z ¨ar z = (I + GFy)−1GFrr + (I + GFy)−1w − (I + GFy)−1GFyn + (I + GFy)−1Gwu

= Gcr + Sw − T n + (I + GFy) −1

(26)

3.4 Styrprinciper 13

Idealt vill man att ¨overf¨oringsfunktionerna fr˚an n, w och wutill z skall vara sm˚a och

att ¨overf¨oringsfunktionen fr˚an r till z ska vara ett. Dessa ¨onskem˚al st˚ar i konflikt med varandra. En annan viktig ¨overf¨oringsfunktion ¨ar den fr˚an w till u.

Gwu= −(I + FyG)

−1

Fy

Eftersom insignalen alltid ¨ar begr¨ansad b¨or inte denna ¨overf¨oringsfunktion blir f¨or

stor. De ¨overf¨oringsfunktioner som kommer formas med H∞-metoden d˚a roboten

regleras ¨ar S, T och Gwu.

Framtagning av viktfunktioner

Om S, T och Gwu fick v¨aljas godtyckligt skulle man ¨onska att S och T var noll

och Gwuvar ett f¨or alla frekvenser. P˚a grund av vissa fundamentala begr¨ansningar

[10] ¨ar inte detta m¨ojligt. Till exempel ¨ar S + T = I och om Fy ¨ar lika med Fr,

vilket kommer vara fallet f¨or robotens regulator s˚a kommer T och Gwuvara samma

¨overf¨oringsfunktion. Viktfunktionerna anv¨ands f¨or att specifiera vilket krav som ¨ar viktigast vid varje frekvens. Detta leder till att man f˚ar krav som kan uppfyllas. Kraven kan sammanfattas till

kWS(iω)S(iω)k < γ

kWT(iω)T (iω)k < γ

kWwu(iω)Gwu(iω)k < γ

d¨ar WS, WT och Wwu¨ar viktfunktioner. Om man, till exempel, vill att ¨overf¨oringsfunktionen

S ska vara stor f¨or l˚aga frekvenser v¨aljer man viktfunktionen liten vid dessa fre-kvenser och tv¨art om.

Det utvidgade systemet

Viktfunktionerna beskriver dynamiska system. D¨arf¨or m˚aste modellen utvidgas

med nya tillst˚and. Om det ursprungliga systemet beskrivs av

y = Gu

med m styrsignaler och p utsignaler, f˚as ett utvidgat system G0med m+p insignaler

och m + 3p utsignaler. De p nya insignalerna betecknas v. Utsignalerna ¨ar z1=Wuu

z2=WTGu

z3=WS(Gu + v)

y =Gu + w

Om ˚aterkopplingen u = −Fuu g¨ors blir ¨overf¨oringsfunktionerna fr˚an v till z

z =   WwuGwu −WTT WSS  = Gecv

(27)

Ber¨akning av styrlag f¨orH∞-reglering

F¨orst skrivs det ¨oppna utvidgade systemet G0 p˚a tillst˚andsform med insignalerna

u och v och utsignalerna z och u enligt:

˙x = Ax + Bu + N v (3.6)

z = M x + Du (3.7)

y = Cx + v (3.8)

I standardformuleringen f¨or H∞-reglering antas att

DT

M D  =  0 I  (3.9)

Detta kan alltid uppfyllas om M -matrisen ¨ar inverterbar genom ett byte av u. F¨or aktuellt system kommer M -matrisen vara inverterbar och detta antagande inneb¨ar s˚aledes ingen begr¨ansnig. Om detta ¨ar uppfyllt f˚as H∞-regulatorn genom att l¨osa

Riccatiekvationen

ATS + SA + MTM + S(γ−2N NT − BBT)S = 0

Givet systemet 3.6-3.8. Om villkoret 3.9 ¨ar uppfyllt, A − N C ¨ar stabil och Ricca-tiekvationen har en positivt semidefinit l¨osning S = Sγ som stabiliserar systemet,

s˚a ¨ar H∞-regulatorn

˙ˆx =Aˆx + N(y − cˆx) u = − BTSγxˆ

(28)

Kapitel 4

Reglerdesign

4.1

Observat¨

or

Alla tillst˚and m¨ats inte. D¨arf¨or anv¨ands ett Kalmanfilter f¨or att skatta dessa. Mo-dellen som anv¨ands f¨or att ta fram Kalmanfiltret ¨ar beskriven i bilaga A. I robot-modellen ¨ar systembruset korrelerat med m¨atrbruset. Detta modelleras enligt

˙x = Ax + Bu + N ν1 y = Cx + Du + w w = M ν1+ ν2 E(νk) = 0, k = 1, 2 Eνw1  νT 1 wT   = R˜1 R˜12 RT 12 R˜2  =  R1 R1MT + R12 M R1+ RT12 M R1MT + M R12+ R12TMT + R2 

d¨ar korsspektrum mellan v1(t) och v2(t) ¨ar R12. Ett Kalmanfilter kan tas fram

enligt kapitel 2.

Simuleringar visar att det ¨ar sv˚art att skatta samtliga tillst˚and. Speciellt sv˚art ¨ar det att skatta tv¨arst¨orkraften, se figur 4.1. Simuleringsresultaten visar att ¨ovriga tillst˚andsskattningar konvergerar relativt bra utom skattningen av Md som

diver-gerar. F¨or att f˚a en uppfattning om varf¨or skattningen av Md inte konvergerar

kan matrisen P i Kalmanfiltret och rangen hos observerbarhetsmatrisen studeras. Om P -matrisen, som beskriver variansen hos skattningsfelet, studeras ¨over tiden, se figur 4.2 element p44 och p55, ser man att variansen f¨or dysfelen Fd och Md ej

f¨or¨andras m¨arkbart efter 0.25 sekunder och ¨ar skilda fr˚an noll. Detta kan tolkas som att variansen hos felen mellan skattade och riktiga v¨arden hos tillst˚anden inte kommer att bli b¨attre med tiden. Matrisen K ¨ar en funktion av P-matrisens in-vers. Elementen i K som har med uppdateringen av Fd:s och Md:s skattningar blir

(29)

0 0.5 1 1.5 −5 0 5 10 dθ/dt [rad/s] 0 0.5 1 1.5 −0.2 0 0.2 0.4 0.6 α [rad] 0 0.5 1 1.5 0 0.5 1 1.5 2 Ett 0 0.5 1 1.5 −4000 −3000 −2000 −1000 0 Fd [N] 0 0.5 1 1.5 −600 −400 −200 0 Md Tid [s] [Nm] 0 0.5 1 1.5 −300 −200 −100 0 k1 Tid [s] [m/s 2]

Figur 4.1. Tillst˚andsskattning d˚a en accelerometer anv¨ands. Streckade linjerna visar

tillst˚anden och punktstreckade linjerna visar skattningarna.

d¨arf¨or sm˚a. Resultatet ¨ar att dessa skattningar kommer att ¨andras l˚angsamt. Man skulle vilja att dessa tillst˚and konvergerade snabbt innan P-matrisen blir f¨or stor. Observerbarhetsmarisen studeras egentligen bara f¨or tidsinvarianta system och ¨ar ej helt till¨ampbar i det tidsvariabla fallet. Den ger dock en indikation p˚a att det kan vara problem med skattningen. F¨or att kunna skatta alla tillst˚and i ett tidsinvariant system kr¨avs det att obserververbarhetsmatrisen har full rang. I figur 4.3 syns det tydligt att rangen minskar med tiden. ¨Aven i b¨orjan ¨ar observerbarhetsmatrisens rang mindre ¨an antalet tillst˚and. F¨or att se vilka linj¨arkombinationen av tillst˚and som ¨ar sv˚ara, eller om¨ojliga, att skatta studeras observerbarhetsmatrisens nollrum.

(30)

4.1 Observat¨or 17 0 1 2 0 1 2 0 1 2 −0.1 0 0.1 0 1 2 −1 0 1 0 1 2 −1000 0 1000 0 1 2 −200 0 200 0 1 2 −10 0 10 0 1 2 −0.1 0 0.1 0 1 2 0 0.005 0.01 0 1 2 −1 0 1 0 1 2 −100 0 100 0 1 2 −10 0 10 0 1 2 −0.5 0 0.5 0 1 2 −1 0 1 0 1 2 −1 0 1 0 1 2 −1 0 1 0 1 2 −1 0 1 0 1 2 −1 0 1 0 1 2 −1 0 1 0 1 2 −1000 0 1000 0 1 2 −100 0 100 0 1 2 −1 0 1 0 1 2 0 5 10x 10 5 0 1 2 −2 −1 0x 10 5 0 1 2 −5000 0 5000 0 1 2 −200 0 200 0 1 2 −10 0 10 0 1 2 −1 0 1 0 1 2 −2 −1 0x 10 5 0 1 2 2.2 2.4 2.6x 10 5 0 1 2 −1000 0 1000 0 1 2 −10 0 10 0 1 2 −0.5 0 0.5 0 1 2 −1 0 1 0 1 2 −5000 0 5000 0 1 2 −1000 0 1000 0 1 2 0 200 400

Figur 4.2.P-matrisen som funktion av tiden.

0 0.5 1 1.5 2 2.2 2.4 2.6 2.8 3 3.2 3.4 3.6 3.8 4 Tid [s] Rang(O)

(31)

Nollrummet sp¨anns av ~vzero1=         0 0.00107021319458 0.22224324669368 −0.82340271357246 −0.52060765254429 −0.03977986094247         T ~vzero2 =         0 −0.00000403227768 −0.00041339427405 0.53446098253572 −0.84518353858309 −0.00400915752183         T

Fd och Md ligger n¨astan helt i observerbarhetsmatrisens nollrum. Detta inneb¨ar

att Fdoch Md¨ar n¨astan om¨ojliga att skatta med ett tidsinvariant syns¨att. Det g˚ar

ju dock att skatta Fd. Detta kan bero p˚a att att teorin f¨or observerbarhet ej helt

g˚ar att ¨overf¨ora p˚a tidsvariabla system.

4.1.1

Inf¨

orande av en extra accelerometer

F¨or att f¨ors¨oka f¨orb¨attra tillst˚andsskattningarna har en extra accelerometer inf¨orts. De tv˚a accelerometrarna kan placeras olika l˚angt ifr˚an varandra och f¨ors¨ok har gjorts med olika konfigurationer. Simuleringsresultat f¨or tre olika konfigurationer

ses nedan. Figur 4.4- 4.6 visar att inf¨orandet av en extra accelerometer inte

f¨orb¨attrar skattningen av Md. Dock blir skattningen av det totala st¨orande

mo-mentet b¨attre n¨ar de tv˚a accelerometrar sitter l˚angt ifr˚an varandra. Insv¨angningen blir d¨aremot h¨aftigare vilket p˚averkar skattningen av anbl˚asningsvinkeln, α, och rotationen relativt ett fast koordinatsystem, ˙θ, till det s¨amre initialt.

4.1.2

Variabelbyte f¨

or ¨

okad observerbarhet

Att skatta momentst¨orningen ¨ar sv˚art eller om¨ojligt. St¨orningens totala moment skattas dock ganska v¨al, se figur 4.5. Det kan allts˚a vara intressant att g¨ora ett tillst˚andsbyte d¨ar ena tillst˚andet ¨ar totala momentet. Det g˚ar att ist¨allet f¨or att anv¨anda Fdoch Mdsom tillst˚and anv¨anda det totala momentet (xtot − xmc)F d +

Md och tv¨arskraften Fd som tillst˚and, se bilaga C. Resultaten i bilaga C leder till

att tillst˚anden (xtot − xmc)Fd+ Md och Md kommer att anv¨andas ist¨allet f¨or Fd

och Md.

4.2

Slutsatser kring observat¨

or

Det ¨ar sv˚art att skatta alla tillst˚anden r¨att. Genom att g¨ora ett tillst˚andsbyte blir dock resultatet b¨attre. En extra accelerometer har lagts till i en annan punkt ¨an den

(32)

4.3 Styrning med LQG 19 0 0.2 0.4 0.6 0.8 1 −5 0 5 dθ/dt [rad/s] 0 0.2 0.4 0.6 0.8 1 −0.5 0 0.5 α [rad] 0 0.2 0.4 0.6 0.8 1 0 1 2 Ett 0 0.2 0.4 0.6 0.8 1 −3000 −2000 −1000 0 Fd [N] 0 0.2 0.4 0.6 0.8 1 −500 0 500 1000 Md [Nm] 0 1 −300 −200 −100 0 k1 [m/s 2] 0 0.2 0.4 0.6 0.8 1 0 100 200 300 k2 Tid [s] [m/s 2] 0 0.2 0.4 0.6 0.8 1 −6000 −4000 −2000 0

Totalt störande moment

Tid [s]

[Nm]

Figur 4.4.Tillst˚andsskattningar d˚a tv˚a accelerometrar i samma position anv¨ands.

Strec-kade linjerna visar tillst˚anden och punktstreckade linjerna visar skattningarna.

ursprungliga accelerometern. ˚Atg¨arderna g¨or inte att skattningarna blir perfekta men de g˚ar att anv¨anda. De tillst˚and som ¨ar viktigast, α och ˙θ skattas dock bra efter ett par tiondels sekunder. Detta ¨ar viktigare ¨an att de konstanta st¨orkrafterna skattas r¨att. Tillst˚andsbeskrivningen i det f¨oljande avsnitten har sju tillst˚and. Det extra tillst˚andet kommer fr˚an den nya accelerometern.

4.3

Styrning med LQG

LQ-styrning ger bra prestanda om modellen ¨ar bra. Om tillst˚anden m¨ats kan sta-bilitetsgarantier ges. Det finns dock inga teoretiska stasta-bilitetsgarantier, d˚a en ob-servat¨or anv¨ands tillsammans med LQ-styrning, n¨ar systemet ej modellerats exakt, se [3]. Verifiering av stabilitet sker d¨arf¨or ofta genom simuleringar. N¨ar ett Kal-manfilter anv¨ands tillsammans med LQ-styrning kallas detta LQG-styrning. Detta st˚ar f¨or Linear Quadratic Gaussian. Gaussian inneb¨ar att det brus som p˚averkar systemet antas vara normalf¨ordelat (Gaussiskt).

LQG-styrning ¨ar relativt vanligt. Eftersom denna metod ger bra prestanda ¨ar det en bra referens n¨ar man vill utv¨ardera andra reglermetoder. Det ¨ar ¨aven in-tressant att utv¨ardera regulatorernas robusthet. I bilaga A beskrivs dynamiken f¨or det system som anv¨ands vid LQ-designen. I tillst˚andsbeskrivningen anv¨ands de nya tillst˚anden som beskriver dysst¨orningarna och ett extra tillst˚and som tillkommer

(33)

0 0.2 0.4 0.6 0.8 1 −5 0 5 10 dθ/dt [rad/s] 0 0.2 0.4 0.6 0.8 1 −0.5 0 0.5 α [rad] 0 0.2 0.4 0.6 0.8 1 0 1 2 Ett 0 0.2 0.4 0.6 0.8 1 −4000 −2000 0 Fd [N] 0 0.2 0.4 0.6 0.8 1 −1000 0 1000 Md [Nm] 0 1 −300 −200 −100 0 k1 [m/s 2] 0 0.2 0.4 0.6 0.8 1 0 100 200 300 k2 Tid [s] [m/s 2] 0 0.2 0.4 0.6 0.8 1 −6000 −4000 −2000 0

Totalt störande moment

Tid [s]

[Nm]

Figur 4.5.Tillst˚andsskattningar d˚a tv˚a accelerometrar med cirka tv˚a meters mellanrum

anv¨ands. Streckade linjerna visar tillst˚anden och punktstreckade linjerna visar

skattning-arna.

d˚a en extra accelerometer anv¨ands.

4.3.1

Styrning med konstanta straffmatriser

Straffmatriserna ¨ar designparametrar och kan v¨aljas p˚a m˚anga s¨att. I detta kapitlet kommer det enklaste fallet diskuteras, vilket ¨ar konstanta straffmatriser.

Styrning d˚a α ses som reglerstorhet

Den reglerstorhet som ska styras ¨ar α, d¨arf¨or v¨aljs M-matrisen i 3.4 till

M =0 1 0 0 0 0 0

Tillst˚ands˚aterkopplingen, L, r¨aknas ut enligt kapitel 2. Eftersom referensf¨oljning ¨onskas och det ¨ar lika m˚anga reglerstorheter som styrsignaler r¨aknas Lr, fram

enligt 4.1 s˚a att statiska f¨orst¨arkningen f¨or det slutna systemet blir lika med en-hetsmatrisen [7].

(34)

4.3 Styrning med LQG 21 0 0.2 0.4 0.6 0.8 1 −5 0 5 10 dθ/dt [rad/s] 0 0.2 0.4 0.6 0.8 1 −0.5 0 0.5 α [rad] 0 0.2 0.4 0.6 0.8 1 0 1 2 Ett 0 0.2 0.4 0.6 0.8 1 −6000 −4000 −2000 0 Fd [N] 0 0.2 0.4 0.6 0.8 1 −1000 0 1000 Md [Nm] 0 1 −300 −200 −100 0 k1 [m/s 2] 0 0.2 0.4 0.6 0.8 1 0 100 200 300 k2 Tid [s] [m/s 2] 0 0.2 0.4 0.6 0.8 1 −10000 −5000 0

Totalt störande moment

Tid [s]

[Nm]

Figur 4.6.Tillst˚andsskattningar d˚a tv˚a accelerometrar med cirka fyra meters mellanrum

anv¨ands. Streckade linjerna visar tillst˚anden och punktstreckade linjerna visar

skattning-arna.

Straffmatriserna ¨ar skal¨arer eftersom det endast ¨ar en reglerstorhet och en styrsig-nal. De v¨aljs till

Q1= 1

Q2= 100

Detta resulterar i att tillst˚ands˚aterkopplingen f˚ar ett utseende ¨over tiden enligt figur 4.7. Styrsignalen f˚ar bidrag fr˚an tillst˚and 1-5, men inte 6 och 7, vilket in-neb¨ar att styrsystemet f¨ors¨oker kompensera f¨or dysfelen Fd och Md, men ej f¨or

m¨atsignalernas konstantfel. Konstantfelen hos m¨atsignalerna ¨ar inga systemst¨orningar som p˚averkar systemet med n˚agra krafter och ska d¨arf¨or inte kompenseras f¨or i ˚aterkopplingen. Eftersom de ¨ar ok¨anda m˚aste de dock skattas, f¨or att kunna f˚a

r¨att information om accelerationen i m¨atsignalerna.

Dysfelen orsakar oscillationer som ¨ar sv˚ara att d¨ampa om endast anbl˚ asnings-vinkeln, α, anv¨ands som reglerstorhet, se figur 4.8. Detta beror p˚a att styrsignalen ¨ar begr¨ansad. Det g˚ar att f˚a ett b¨attre d¨ampat system om st¨orre straff l¨aggs p˚a α i f¨orh˚allande till straffet p˚a styrsignalen, δ. Detta snabbar upp systemet. Ist¨allet f¨or att ¨oka straffen p˚a α kan ˙θ tas med som reglerstorhet. Detta kommer att d¨ampa sv¨angningarna i α, vilket ¨ar beskrivet nedan.

(35)

0 1 2 −2.5 −2 −1.5 −1 −0.5 0 0.5 1x 10 −8 0 1 2 −16 −14 −12 −10 −8 −6 −4 −2 0 2x 10 −10 0 1 2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 0 1 2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 0 1 2 −1 0 1 2 3 4 5 6 7 8x 10 −5 0 1 2 −2 0 2 4 6x 10 −4 0 1 2 −2 0 2 4 6 8 10 12 14 16 18x 10 −7

Figur 4.7.Lsom funktion av tiden d˚a α ¨ar reglerstorhet

Styrning d˚a α och ˙θ ses som reglerstorhet

I figur 4.8 syns det att sv¨angningarna i ˙θ, ligger f¨ore sv¨angningarna i α. Detta ¨ar logisk om dynamiken f¨or systemet studeras. Anbl˚asningsvinkeln α ¨ar ungef¨ar integralen av ˙θ. F¨or att f˚a en anbl˚asningsvinkel m˚aste roboten sv¨anga upp vilket ger vinkelaccelerationer. Om ˙θ inf¨ors som reglerstorhet och referenssignalen f¨or denna s¨atts till noll kommer ett b¨attre d¨ampat system att f˚as ¨an d˚a endast α ses som reglerstorhet.

Om α och ˙θ anv¨ands som reglerstorheter kommer M-matrisen att se ut enligt:

M =1 0 0 0 0 0 0

0 1 0 0 0 0 0



En tillst˚ands˚aterkoppling r¨aknas ut enligt kapitel 3. Om ˙θ inf¨ors som reglerstorhet kommer antalet reglerstorheter vara st¨orre ¨an antalet styrsignaler. Detta inneb¨ar att Lr inte kan ber¨aknas p˚a samma s¨att som tidigare. Eftersom referensen till ˙θ

kommer vara noll kommer den del av Lr som har med ˙θ-referens att g¨ora alltid

att vara noll. D˚a systemet ¨ar detsamma kommer den delen av Lr som har med

α-referens att g¨ora att vara densamma som tidigare. Om straffmatriserna v¨aljs till Q1=1 00 1



(36)

4.3 Styrning med LQG 23 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −4 −2 0 2 4 dθ/dt [rad/s] 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −0.1 0 0.1 0.2 0.3 α med referens [rad] α Ref 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −0.5 0 0.5 δ Tid [s] [rad]

Figur 4.8.Utsignal och insignal med LQ-styrning d˚a endast α ¨ar reglerstorhet.

kommer L att variera enligt figur 4.9. Om figur 4.7 och 4.9 studeras framg˚ar det att L-matrisens element har ¨andrats b˚ade till storlek och utseende. Intressant ¨ar att f¨orh˚allandet mellan ˚aterkopplingen p˚a ˙θ och α, tillst˚and 1 och 2, har ¨andrats. Detta kan tolkas som att reglersystemet kommer att anv¨anda sig mer av informationen fr˚an ˙θ ¨an tidigare. Simulering, se figur 4.10 visar att system blir b¨attre d¨ampat, trots att styrsignalen inte har ¨okat. Detta ¨ar mycket bra. Eftersom systemet ¨ar tidsvariabelt b¨or tidsvariabla straff ge b¨attre resultat. Nedan har ett test gjorts med tidsvariabla straff.

4.3.2

Styrning med tidsvariabla straffmatriser

Eftersom styrsignalen initialt ¨ar stor b¨or straffet f¨or den inledningsvis vara stort. Styrkraften ¨okar med skjutf¨orloppet och det ¨ar l¨ampligt att v¨alja ett avtagande straff p˚a styrsignalen. F¨or straffet p˚a α g¨aller det motsatta. Initialt ska det va-ra litet f¨or att sedan v¨axa. Det visar sig att om tidsvariabla stva-raff anv¨ands blir styrkraften stor initialt oavsett vilket straff som l¨aggs p˚a α. Detta beror p˚a Lr

som hela tiden f¨ors¨oker kompensera f¨or referensv¨ardets avvikelse fr˚an noll. Under den f¨orsta halvsekunden ¨ar absolutbeloppet av denna kompensation st¨orre ¨an 0.15, vilket ¨ar maxv¨ardet p˚a roderutslaget. Referenssignalen ¨ar st¨orre ¨an systemet kla-rar av att f¨olja vid l˚aga hastigheter. Det ¨ar om¨ojligt att f˚a b˚ade referensf¨oljning och d¨ampning av de dysst¨orningsberoende sv¨angningarna om denna referenssignal beh˚alls. En m¨ojlighet ¨ar att referenssignalen f¨or ˙θ h˚alls till noll under den f¨orsta

(37)

0 1 2 −6 −5 −4 −3 −2 −1 0 1 2x 10 −6 0 1 2 −6 −5 −4 −3 −2 −1 0x 10 −7 0 1 2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 0 1 2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 0 1 2 −0.1 −0.08 −0.06 −0.04 −0.02 0 0.02 0.04 0.06 0.08 0.1 0 1 2 −2 −1.8 −1.6 −1.4 −1.2 −1 −0.8 −0.6 −0.4 −0.2 0 0 1 2 0 2 4 6 8x 10 −4

Figur 4.9.L d˚a b˚ade α och ˙θ straffas.

halvsekunden. En annan l¨osning ¨ar att koppla bort Lr den f¨orsta halvsekunden.

Det senare resulterar i att sv¨angningarna d¨ampas, men att systemet styr in mot nollreferens. Problemet ¨ar fundamentalt och beror p˚a att styrkraften ¨ar begr¨ansad och att dysfelen ¨ar stora. Problemen uppkommer ¨aven f¨or H∞-styrningen. En

si-mulering d¨ar Lr ¨ar urkopplad den f¨orsta halvsekunden ses i figur 4.11. Det syns

tydligt att insignalen ¨ar betydligt mindre ¨an tidigare de f¨orsta tre tiondels se-kunderna. Detta inneb¨ar att en bra d¨ampning f˚as trots styrsignalbegr¨ansningarna. Tidsvariabla straff l¨oser allts˚a inte problemen med f¨or stora styrsignaler initialt, utan speciall¨osningar m˚aste tas till.

4.4

Slutsatser kring LQ-styrning

Det ¨ar ganska l¨att att f˚a ett bra upptr¨adande med LQ-tekniken och den st¨odjer tidsvariabla system. Det finns dock vissa fundamentala begr¨ansningar och det kr¨avs specialknep f¨or att f˚a riktigt bra prestanda. Alltf¨or stora krav p˚a α kan inte st¨allas den f¨orsta halvsekunden eftersom robotens hastighet ¨ar f¨or liten f¨or att ge tillr¨acklig styrkraft.

F¨or att f¨orenkla j¨amf¨orelse med H∞-regulatorn har en LQ-l¨osning med

(38)

4.5 Styrning med H∞ 25 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −4 −2 0 2 4 dθ/dt [rad/s] 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −0.1 0 0.1 0.2 0.3 α med referens [rad] α Ref 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −0.5 0 0.5 δ Tid [s] [rad]

Figur 4.10.Plot avα, ˙θ och δ d˚a b˚ade α och ˙θ straffas

4.5

Styrning med H

F¨or att kunna till¨ampa H∞-styrning p˚a ett linj¨art tidsvariabelt system m˚aste viss

modifiering g¨oras. H¨ar har systemet gridats med tiden som parameter. Om ¨aven olinj¨ariteter ska beaktas m˚aste regulatorn gridas, men d˚a med aktuella tillst˚and

som parametrar. Detta ¨ar dock inte gjort i denna rapport. H∞-designen utg˚ar

ifr˚an att reglerstorheten eller reglerstorheterna m¨ats med m¨atbrus. H¨ar ¨ar de verk-liga m¨atsignalerna en linj¨arkombination av reglerstorheter och ¨ovriga tillst˚and med p˚alagt m¨atbrus. Detta kan ˚atg¨ardas genom att en observat¨or skattar reglerstorhe-terna och sedan betraktar dessa som m¨atsignaler med ett fiktivt m¨atbrus. F¨or att skatta reglerstorheter anv¨ands samma observat¨or som anv¨ants f¨or LQG-styrningen. H∞-regulatorn har ¨aven en egen observat¨or, vilken forts¨attningsvis kallas H∞

-observat¨or, som skattar reglerstorheterna och de tillst˚and som beh¨ovs f¨or att be-skriva dynamiken hos viktfunktionerna, se kapitel 3. De konstanta st¨orningar som modellerats i den f¨orsta observat¨oren ¨ar dock inte modellerade i H∞-regulatorn.

Till att b¨orja med kommer reglersystemet att testas d˚a reglerstorheten

an-ses vara k¨and. Detta f¨or att kunna h˚alla is¨ar vilka effekter som kommer fr˚an

ob-servat¨oren och vilka som kommer fr˚an regulatorn. Sedan testas regulatorn

till-sammans med observat¨oren f¨or att se om n˚agon komplikation dyker upp. H∞ ¨ar

en robust reglermetod. Detta b¨or inneb¨ara att f¨arre gridpunkter beh¨ovs ¨an d˚a

mindre robusta metoder anv¨ands. ¨Aven LQG kan anv¨andas med gridning, men

(39)

LQG-0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −4 −2 0 2 4 dθ/dt [rad/s] 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −0.1 0 0.1 0.2 0.3 α med referens [rad] α Ref 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −0.5 0 0.5 δ Tid [s] [rad]

Figur 4.11.Systemupptr¨adande d˚a tidsvariabla straff anv¨ands och Lr ¨ar urkopplad de

5 f¨orsta tiondels sekunderna

regulator anv¨ants som j¨amf¨orelse med H∞-regulatorn. Eftersom en betydande del

av systemst¨orningarna ¨ar dysfel fr˚an motorn kommer det i H∞-designen l¨aggas

stor vikt p˚a att styrsystemet klarar av dessa st¨orningar.

4.5.1

Diskussion kring viktfunktioner

En av de st¨orsta sv˚arigheterna med H∞-metoden ¨ar att v¨alja bra

viktfunktio-ner. Regulatorn p˚averkas kraftigt av viktvalet. Det finns dock vissa fundamenta-la krav som g¨or valet av viktfunktion l¨attare. Dessa ger en ledning och beskrivs

nedan. Eftersom Fy och Fr, se figur 3.1, ¨ar lika kommer T och Gwu att vara

samma ¨overf¨oringsfunktion. F¨or att f˚a referensf¨oljning kr¨avs att komplement¨ara k¨anslighetsfunktionen ¨ar ett vid l˚aga frekvenser. F¨or h¨oga frekvenser m˚aste den d¨aremot vara liten s˚a att de h¨ogfrekventa m¨atst¨orningarna inte f¨orst¨arks f¨or myc-ket. Eftersom roboten p˚averkas av l˚agfrekventa kraftst¨orningar fr˚an drivmotorn m˚aste k¨anslighetsfunktionen, S, vara liten vid l˚aga frekvenser. F¨or att helt reglera

ut dysfelen m˚aste S n¨arma sig frekvensen noll som 1/s. Som n¨amnts i kapitel 3

fungerar vikterna s˚a att T kommer att ligga under W−1

T γ. Detsamma g¨aller f¨or

¨ovriga viktfunktioner. ¨Overg˚angen mellan h¨og och l˚ag f¨orst¨arkning f¨or WT kan

ske snabbt eller l˚angsamt beroende p˚a antalet poler. Det ¨ar ¨onskv¨art med s˚a f˚a poler som m¨ojligt, eftersom varje pol ger upphov till ett nytt tillst˚and hos regu-latorn. D¨arf¨or har en viktsfunktion med principutseendet nedan och l˚agt gradtal

(40)

4.5 Styrning med H∞ 27

anv¨ants. N¨ar principutseende ¨ar valt m˚aste parametrarna best¨ammas. Eftersom vi har gridat i tiden kr¨avs en viktsfunktion f¨or varje tidsintervall. Initialt anv¨ands viktsfunktionerna WS = ω s (4.2) WT = ω0(s + ω1) s + ω2 (4.3) Wu= 1 (4.4)

4.5.2

Parametrarnas betydelse

N¨ar principutseendet p˚a viktfunktionerna valts m˚aste parameterv¨arden v¨aljas s˚a att systemet f˚ar ¨onskat beteende. F¨or att unders¨oka parametrarnas betydelse har flera olika parameterupps¨atningar testats i de olika designpunkterna. Vid dessa simuleringar har systemet h˚allits konstant och simuleringstiden har varit 0.5 se-kunder. F¨or att belysa parametrarnas betydelse har tv˚a reglerdesigner gjorts och Bodediagram och simuleringsresultat har j¨amf¨orts. Den parameter som ¨andrats ¨ar

ω0. Om ω0 = 25 kommer den komplement¨ara k¨ansklighetsfunktionen att sakna

10−3 10−2 10−1 100 101 102 103 10−3 10−2 10−1 100 101

Figur 4.12.Bodediagram av T med tillh¨orande inversa viktfunktion (ω0= 25)

resonanstopp, se figur 4.12 Simuleringar av systemet visar att det uppf¨or sig som f¨orv¨antat med ett acceptabelt stegsvar, se figur 4.13. Om parametern ω0 ¨andras

f˚ar k¨anslighetsfunktionen ett annat utseende. N¨ar ω0 minskas till 10 kan

(41)

0 0.5 1 1.5 −0.03 −0.02 −0.01 0 0.01 0.02 0.03 [rad] Tid [s] α Ref

Figur 4.13.Stegsvar d˚a systemet ¨ar tidsinvariant (ω0= 25)

En resonanstopp uppkommer vid cirka 60 rad/s, se figur 4.14. Simuleringar veri-fierar ett sv¨angigare systembeteende, j¨amf¨or figur 4.13 och 4.15.

N¨ar viktfunktionernas parametrar ¨andras kommer i vissa fall ¨aven principut-seendet hos de ¨overf¨oringsfunktioner som ska formas att ¨andras. Varje parameter p˚averkar systemet och f¨or att f˚a ¨onskat utseende m˚aste flera parameterval testas och j¨amf¨oras.

Det ¨ar ganska l¨att att f˚a ett acceptabelt upptr¨adande n¨ar systemet h˚alls kon-stant. Bodediagrammet beskriver systemets egenskaper v¨al, vilket syns ovan. Det g˚ar allts˚a att f¨orutse hur systemet kommer att bete sig. N¨ar det tidsvariabla syste-met anv¨ands ¨ar det inte lika enkelt. D˚a ger Bodediagrammen endast en fingervisning och simuleringar m˚aste anv¨andas f¨or att kontrollera systemupptr¨adandet.

4.5.3

H

med parameterstyrning och tidsvariabelt system

Viktfunktionerna ovan gav bra regulatorer ¨aven f¨or det tidsinvarianta systemet. Att goda resultat f˚as f¨or tidsvariabla system kan inte garanteras utan m˚aste ve-rifieras med simuleringar. Resultatet beror ocks˚a p˚a hur m˚anga gridpunkter som anv¨ants. Ju fler punkter desto b¨attre resultat. En komplikation som dyker upp

vid parameterstyrning ¨ar effekter som uppkommer d˚a man byter regulator. Det

finns ingen b¨asta metod f¨or hur ¨overg˚angarna ska ske. Till exempel kan interpola-tion eller direkta hopp mellan regulatorerna anv¨andas. H¨ar kommer simuleringar att anv¨andas f¨or att unders¨oka metoderna. Eftersom systemet ska klara av dysfel kommer simuleringarna i detta kapitel inkludera s˚adana.

(42)

4.5 Styrning med H∞ 29 10−3 10−2 10−1 100 101 102 103 10−3 10−2 10−1 100 101

Figur 4.14.Bodediagram av T med tillh¨orande inversa viktfunktion (ω0= 10)

0 0.5 1 1.5 −0.04 −0.03 −0.02 −0.01 0 0.01 0.02 0.03 0.04 [rad] Tid [s] α Ref

(43)

Ett urartat fall av parameterstyrning ¨ar att endast en regulator anv¨ands. Hur systemet beter sig d˚a regulatorn i kapitel 4.5.2 anv¨ands ses i figur 4.16 ¨Aven om

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −3 −2 −1 0 1 2 3 [rad] Tid [s] α Ref

Figur 4.16.αmed referens ˙θ och δ d˚a endast en regulator anv¨ands.

H∞-metoden ska generera regulatorer som ¨ar robusta mot modellvariationer blir

simuleringsresultatet d˚aligt d˚a endast en regulator anv¨ands p˚a det tidsvariabla sy-stemet. Detta ¨ar inte f¨orv˚anande eftersom systemet f¨or¨andras radikalt. En regulator r¨acker allts˚a inte, utan flera m˚aste anv¨andas f¨or det tidsvariabla systemet.

F¨or att f˚a en uppfattning om var i tiden systemf¨or¨andringarna ¨ar som st¨orst kan systemmatrisen studeras. Man ser d˚a att systemet f¨or¨andras v¨aldigt snabbt i b¨orjan av uppskjutningen. D¨arf¨or ¨ar det l¨ampligt att testa om det blir b¨attre med fler regulatorer i b¨orjan.

Det finns flera s¨att att byta mellan regulatorerna. En metod ¨ar att interpolera regulatorv¨ardena. En annan ¨ar att g¨ora abrubta byten vid best¨amda tidpunkter. Det visar sig vara ol¨ampligt att anv¨anda interpolation. Systemet uppf¨or sig olo-giskt och blir ofta instabilt. Att systemet blir instabilt beror f¨ormodligen p˚a att

H∞-metoden tar fram regulatorer som fungerar i gridpunkten och dess omgivning

men den interpolerade regulatorns egenskaper ¨ar ok¨anda och resulterar i ett slutet system utan stabilitetsgarantier. De simuleringar som g¨ors med interpolerande re-gulator visar att systemet sv¨anger kraftigt. Detta visas i figur 4.17. ¨Aven tidigare studier av dimensionering av robotstyrsystem, i f¨oretaget, har visat att abrupta byten ¨ar att f¨oredra framf¨or interpolation. Om abrubta byten mellan regulato-rerna anv¨ands f˚as betydligt b¨attre resultat. Detta ses i figur 4.18. Det blir dock st¨otar i styrsignalen vid regulatorbytet. Detta beror p˚a att tillst˚anden i regulatorn

(44)

4.5 Styrning med H∞ 31 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 [rad] Tid [s] α Ref

Figur 4.17.Simulering med tv˚a regulatorer d˚a interpolation mellan regulatorer anv¨ands

¨andrar betydelse n¨ar en ny regulator tar vid. F¨ormodligen ¨ar det b¨asta s¨attet att ˚atg¨arda detta att r¨akna ut vad den nya regulatorns tillst˚and ska ha f¨or v¨arden f¨or att motsvara den gamla. Detta ¨ar inte helt trivialt. Tv˚a metoder f¨or regulatorbyte har anv¨ants. Den f¨orsta ignorerar att tillst˚anden ¨andrar betydelse vilket som ovan n¨amnts ger st¨otar. Den andra l˚ater ett eller flera tillst˚and anpassa sig innan de anv¨ands f¨or utsignalsber¨akning. Ibland kan st¨otarna elimineras men det ¨ar sv˚art att f¨orutse hur l˚ang tid tillst˚anden beh¨over f¨or att stabilisera sig. Det visar sig ¨aven att instabilitet i styrningen kan uppst˚a medan tillst˚anden h˚aller p˚a att stabilisera sig. Om de f˚ar f¨or kort tid p˚a sig kommer st¨otarna inte att f¨orsvinna och vid f¨or l˚anga adaptionstider kan systemet bli instabilt och divergera. Eftersom st¨otarna ¨ar kortvariga och inte p˚averkar systemet alltf¨or mycket kommer forts¨attningsvis ingen h¨ansyn att tas till dem. Det finns andra metoder som kan minska st¨otarna. Till exempel kan ett eller flera tillst˚and korrigeras s˚a att styrsignalen har samma v¨arde efter och f¨ore regulatorbytet. Denna eller andra metoder att minska st¨otar vid ¨overg˚ang behandlas dock inte i detta exjobb.

Om tv˚a regulatorer anv¨ands blir resultaten betydligt b¨attre ¨an om endast en anv¨ands. Detta visas i figur 4.18. St¨otarna i insignalen orsakar ibland st¨orningarna i tillst˚anden, men ¨ar inte avg¨orande f¨or systemprestandan. Om ingen ny regulator anv¨ands efter 0.5 sekunder f˚as ett stort reglerfel. Detta beror f¨ormodligen p˚a att systemet avviker f¨or mycket fr˚an systemet som regulatorn ¨ar designad f¨or. Syste-mets uppf¨or sig dock godtagbart den f¨orsta halvsekunden. Systemet ¨ar sv¨angigare i b¨orjan ¨an d˚a LQ-styrningen anv¨ands. En st¨orre d¨ampning beh¨ovs. Hur m˚anga

(45)

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −0.1 −0.05 0 0.05 0.1 0.15 0.2 0.25 0.3 [rad] Tid [s] α Ref

Figur 4.18.αmed referens d˚a tv˚a regulatorer anv¨ands med direkta byten

regulatorer det kr¨avs f¨or att f˚a bra styrning ¨ar sv˚art att f¨orutse. Detta m˚aste kon-trolleras genom simuleringar. ¨Aven om m˚anga regulatorer anv¨ands ¨ar det sv˚art att kommma ifr˚an att systemet blir sv¨angigt initialt. Den erh˚allna prestandan ¨ar be-tydligt s¨amre ¨an den som erh˚allits med LQG-styrning. Eftersom designen leder till

Bodediagram utan, eller med sm˚a f¨orst¨arkningar vid resonansfrekvensen, och de

tidsinvarianta simuleringarna ger sm˚a sv¨angningar beror f¨ormodligen sv¨angigheten

p˚a de tidsvariabla effekterna. Systemet ¨andras i tiden och Bodediagrammet

kom-mer inte st¨amma med det slutna systemet vid en tid skild fr˚an den som regulatorn ¨ar framtagen f¨or. F¨or att f¨ors¨oka ¨oka d¨ampningen av egenfrekvensen har ytterli-gare tre metoder testats. I den f¨orsta kommer ˙θ att tas med som reglerstorhet. Sv¨angningar i ˙θ ger upphov till att ¨aven α sv¨anger, eftersom ˙θ f¨orenklat kan ses som en l˚agpassfiltrering av ˙θ. Det visar sig dock sv˚art att inkludera ˙θ som regler-storhet eftersom α och ˙θ ¨ar starkt beroende av varandra och endast en styrsignal ¨ar tillg¨anglig. Mer om detta i kapitel 4.5.4. Den andra metoden g˚ar ut p˚a att reglera ˙θ med liknande viktfunktioner som anv¨ants f¨or α. Detta ¨ar beskrivet i kapitel 4.5.4. Slutligen har en viktfunktion som trycker ned egenfrekvensen testats. S˚adana vik-ter har anv¨ants f¨or b˚ade α och ˙θ. N¨ar sv¨angningen d¨ott ut ¨overg˚ar man till det tidigare framtagna reglersystemet f¨or att f˚a referensf¨oljning i α.

4.5.4

Tre f¨

ors¨

ok till sv¨

angningsreducering

F¨or att b¨attre d¨ampa sv¨angningarna som uppst˚ar p˚a grund av dysfelen under den f¨orsta halvsekunden har tre olika f¨ors¨ok gjort. De tv˚a f¨orsta visar sig ge otillr¨acklig

(46)

4.5 Styrning med H∞ 33

prestanda, medan det tredje fungerar acceptabelt.

H∞ d¨ar b˚adeα och ˙θ ses som reglerstorheter

F¨or att f˚a b¨attre d¨ampning i systemet vill vi forma ¨overf¨oringsfunktionen f¨or ˙θ. D˚a reglerstorheterna ¨ar flera anv¨ands ofta diagonala staffmatriser [7]. Initialt anv¨ands samma viktfunktioner f¨or ˙θ som f¨or α. Tanken ¨ar att ˙θ ska ha noll som referenssig-nal f¨or att f˚a ner storleken p˚a ˙θ:s sv¨angningar. Det visar sig dock sv˚art att hitta regulatorer som uppfyller kraven specificerade av viktfunktionerna f¨or α och ˙θ.

Eftersom vi vill ha d¨ampning av egenfrekvensen har viktfunktionen valts s˚a

att den ¨ar stor kring egenfrekvensen. F¨orhoppningen ¨ar att detta ska leda till att sv¨angningarna i α blir mindre. Tyv¨arr var det ¨aven h¨ar sv˚art att hitta regulatorer som uppfyller kraven specificerade av viktfunktionerna. Test har ocks˚a gjorts d¨ar k¨anslighetsfunktionens vikt f¨or ˙θ inte avtar som 1/s d˚a frekvensen g˚ar mot noll. D˚a kommer den fiktiva st¨orningen, w, in som direktterm i de fiktiva utsignalerna zi. Detta leder till att det utvidgade systemet inte l¨angre ¨ar beskrivet enligt

stan-dardformuleringen f¨or H∞-metoden i []. Det g˚ar dock att skriva om ett system d¨ar

w kommer in i ekvationerna f¨or z3p˚a standardform. Hur detta g¨ors ¨ar beskrivet av

Safonov i [9]. I matlabs funktioner f¨or H∞ ¨ar Safonovs resultat inlagda och dessa

funktioner kan anv¨andas direkt utan att skriva om systemet.

Om straffunktionerna v¨aljs p˚a samma s¨att f¨or ˙θ som f¨or α kommer straffen p˚a ˙θ att komma i konflikt med ¨onskat utseende p˚a α:s komplement¨ara k¨anslighets-funktion. F¨or att undvika detta m˚aste sambandet mellan α och ˙θ studeras. F¨orenklat kan α ses som en l˚agpassfiltrering av ˙θ. Detta g¨or att komplement¨ara k¨ansklighets-funktionen f¨or ˙θ ¨ar k¨anslighetsk¨ansklighets-funktionen f¨or α g˚anger inversen av l˚agpassfiltret mellan ˙θ och α. Om detta beaktas vid utformandet av vikten f¨or αs komplement¨ara k¨anslighetsfunktion kommer denna att bli ungef¨ar som ¨onskats. Vid simuleringar beter sig dock systemet v¨aldigt d˚aligt. En anledning till detta kan vara valet att viktfunktionerna ska vara diagonala. Inga krav st¨alls d˚a p˚a ¨overf¨oringsfunktionen fr˚an ˙θ-referens till α och vice versa. Att ha en full viktfunktionsmatris skulle m¨ojligtvis kunna fungera men har ej testats h¨ar.

Styrning med initiala viktfunktioner och ˙θ-referens

Att ha α som referenssignal visar sig allts˚a fungera d˚aligt och att ha b˚ade α och ˙θ ger ett alltf¨or d˚aligt upptr¨adande. D¨arf¨or har ett f¨ors¨ok med alternerande referenssignal studerats. Id´en ¨ar att b¨attre d¨ampning kan uppn˚as om ˙θ har referenssignal noll vid l˚aga hastigheter f¨or att sedan vid h¨ogre hastighet byta till att ge α referenssignal. Det visar sig att det inte blir m¨arkbart b¨attre om inte nya viktfunktioner tas fram.

(47)

Styrning initialt med ny viktfunktion p˚a α och ˙θ

Eftersom egenfrekvensen ska d¨ampas har viktfunktioner med stor vikt omkring systemets egenfrekvensen valts. Nya viktfunktioner f¨or d¨ampning ¨ar:

WS = ω s (4.5) WT = m s2+ as + b2 s2+ cs + b2 (4.6) Wu= 1 (4.7)

Det visar sig att b¨attre d¨ampning kan uppn˚as med denna typ av vikt. F¨ors¨ok har gjorts b˚ade med α och ˙θ som referens. I figur 4.19 ses resulterande komplement¨ara k¨anslighetsfunktionen d˚a α ¨ar referens f¨ore 0.3 sekunder. H¨ar syns det att b¨attre

d¨ampning uppn˚atts av egenfrekvensen. Denna ¨ar ungef¨ar 30 rad/s vid den

aktu-ella tidpunkten. Det ¨ar l¨attare att d¨ampa ut sv¨angningarna om ˙θ anv¨ands som

10−3 10−2 10−1 100 101 102 103 104 10−7 10−6 10−5 10−4 10−3 10−2 10−1 100 101

Figur 4.19.Bodeplot av T , nedre kurvan, och WTsom multiplicerats med γ

referens, vilket ses i figur 4.20. I figuren syns ¨aven att α driver iv¨ag fr˚an noll om ˙θ-referens anv¨ands. Det ¨ar viktigt att inte α driver iv¨ag f¨or l˚angt under den f¨orsta halvsekunden och d¨arf¨or har α anv¨ants som referens nedan.

4.5.5

Reglerstrategibyte f¨

or H

Vi vill ha referensf¨oljning d˚a st¨orre styrkraft finns. D¨arf¨or m˚aste en ¨overg˚ang fr˚an d¨ampning till referensf¨oljning g¨oras. En strategi f¨or hur bytet av regulator ska g˚a

(48)

4.6 Slutsatser kring H∞-regulatorn 35 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 −2 0 2 4 6 dθ/dt [rad/s] α−ref dθd/dt−ref 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 −0.1 0 0.1 0.2 0.3 α [rad] α−ref dθd/dt−ref 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 −0.5 0 0.5 δ Tid [s] [rad] α−ref dθd/dt−ref

Figur 4.20.J¨amf¨orelse av d¨ampning med α och ˙θ som referens

till f¨or att undvika st¨otar i s˚a stor m˚an som m¨ojligt m˚aste dock utarbetas. F¨or att f¨ors¨oka undvika kraftiga st¨otar i insignalen d˚a byte av regulatortyp g¨ors kommer de b˚ada regulatortyperna f˚a insignaler fr˚an start. Detta leder till att den senare regulatorn hinner st¨alla in sina tillst˚and innan den tar ¨over regleringen. N¨ar bytet sker f¨ors¨oker regulatorn f¨olja referensen. Ett hopp i insignalen ¨ar att v¨anta. Id´en visar sig fungera godtagbart, se figur 4.21, och inga andra metoder har d¨arf¨or testats f¨or byte av regulatortyp.

4.6

Slutsatser kring H

-regulatorn

F¨or tidsvariabla system beskriver inte Bodediagrammen systemuppf¨orandet. De ger dock en fingervisning om hur systemet beter sig. Det ¨ar betydligt enklare att

hitta acceptabla reglersystem med LQ-metoder ¨an med H∞-design. Delvis beror

detta p˚a att LQ-metoder st¨odjer tidsvariabla system. Att det ¨ar mer intuitivt att v¨alja straffmatriser ¨an viktsfunktioner g¨or ocks˚a LQ-designen enklare.

F¨or att f˚a godtagbara resultat vid H∞-design ¨ar det n¨odv¨andigt att anv¨anda

viktfunktioner med h¨oga krav p˚a d¨ampning av resonansfrekvensen. Regulatorn ska f¨orst d¨ampa sv¨angningar som uppst˚ar p˚a grund av dysfelen f¨or att sedan ¨overg˚a till referensf¨oljning. D˚a f˚as prestanda som kan j¨amf¨oras med den som f˚as f¨or LQ-regulatorn med konstanta straffmatriser.

(49)

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −4 −2 0 2 4 dθ/dt [rad/s] 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −0.1 0 0.1 0.2 0.3 α med referens [rad] α Ref 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −0.5 0 0.5 1 δ Tid [s] [rad]

(50)

Kapitel 5

amf¨

orelse mellan

reglermetoder

Eftersom H∞¨ar en metod som ska generera robustare regulatorer ¨an LQ-tekniken

¨ar det intressant att g¨ora j¨amf¨orelser mellan regulatorer av de tv˚a typerna. Tester kan inkludera olika typer av modellfel och systemst¨orningar. Flera typer av mo-dellfel ¨ar av intresse varav n˚agra beskrivs nedan. Endast vissa av dessa har dock testats.

Vi har anv¨ant den linj¨ara tidsvarianta modellen vid reglerdesignen. Linj¨ariserin-gen ger en bra modell f¨or sm˚a anbl˚asningsvinklar, medan den f¨or st¨orre vinklar inte st¨ammer lika bra. Vid simuleringarna ¨ar accelerationen konstant och k¨and. I verkligheten brinner dock motorn olika vid olika skjutningar. De aerodynamiska ko-efficienterna har antagits vara triviala linj¨ara funktioner. De ¨ar egentligen olinj¨ara

funktioner som bland annat beror av robotens hastighet och anbl˚asningsvinkeln.

Man b¨or unders¨oka hur regulatorn designad f¨or en linj¨ar modell klarar att reglera den olinj¨ara modellen. ¨Aven effekter fr˚an aerodynamiken ¨ar intressanta att stude-ra. Det st¨orsta problemet vid reglerdesignen ¨ar att de aerodynamiska rodren inte kan leverera tillr¨ackligt med kraft vid l˚aga hastigheter. De tester vi utf¨or invol-verar d¨arf¨or aerodynamiska effekter och styrsignalbegr¨ansningar. Effekter av stora anbl˚asningsvinklar unders¨oks ej.

5.1

orklaring och diskussion kring testutf¨

orande

Tv˚a reglersystem j¨amf¨ors f¨or att se p˚a f¨ordelar och nackdelar. De regulatorer som

j¨amf¨ors ¨ar en LQ-regulator med konstanta straff, d¨ar straffen ¨ar Q1 = 1 och

Q2= 100, och en H∞-regulator d¨ar en viktfunktion som ska d¨ampa sv¨angningarna

anv¨ands initialt f¨or att sedan bytas mot en viktfunktion som ska se till att α f¨oljer en referenssignal. D¨ampningsregulatorer framtagna med viktfunktionerna 4.5-4.7, ¨ar designade vid 0.1, 0.2 och 0.3 sekunder. Dess parametrar ¨ar valda enligt tabell 5.1. Referensf¨oljningsregulatorer ¨ar framtagna vid tiderna 0.25, 0.5 och 0.7 sekunder.

(51)

F¨or referensf¨oljningsregulatorerna som ¨ar framtagna med viktfunktionerna 4.2-4.4, ¨ar parametrarna valda enligt tabell 5.2.

Tid [s] ω m a b c

0.1 0.01 1 20 20 2

0.2 0.1 1 20 20 2

0.3 0.2 1 30 30 3

Tabell 5.1.Parameterv¨arden d˚a viktfunktionerna 4.5-4.7 anv¨ands

Tid [s] ω ω0 ω1 ω2

0.25 0.02 25 50 125

0.5 10 25 50 125

0.7 50 25 50 125

Tabell 5.2.Parameterv¨arden d˚a viktfunktionerna 4.2-4.4 anv¨ands

Byte mellan d¨ampnings- och referensf¨oljningsregulator sker vid 0.35 sekunder. Anledningen att en referensf¨oljningsregulator ¨ar designad redan vid 0.25 sekunder ¨ar att tillst˚anden ska hinna anpassa sig innan bytet sker.

5.2

Beskrivning av tester

Testerna som utf¨orts kan delas in i prestanda- och robusthetstester. Prestandates-ten unders¨oker hur systemen klarar att reglera det system de ¨ar framtagna f¨or. I robusthetstesterna inf¨ors modellf¨or¨andringar. F¨or att isolera vilka effekter som har med regulatorerna att g¨ora och vilka som beror p˚a tillst˚andsskattningen utf¨ors testerna b˚ade med och utan observat¨or. Eftersom prioritet har lagts p˚a att klara av konstanta dysfelsst¨orningar ¨ar givetvis s˚adana test intressanta. F¨or att kunna isolera olika effekter g¨ors f¨oljande tester:

• Referensf¨oljningstest utan dysfel • Dysfelstest med referenssignal noll • Referensf¨oljningstest med dysfel

Referenssignalerna ¨ar styckvis linj¨ara och g¨or ibland abrupta steg. Referenssigna-len ¨ar anbl˚asningsvinkeln men ofta ¨ar reglerstorheten tv¨arsaccelerationen. Tv¨ars-accelerationen f¨orh˚aller sig till α ungef¨ar som αv2, samtidigt som styrkraften ¨okar

med v2. Det ¨ar d¨arf¨or linj¨art ¨okande och minskande referenssignaler valts. Med

en-bart steg i referenssignalen skulle man f˚a v¨aldigt l˚aga krav p˚a tv¨arsaccelerationer initialt och extremt h¨oga vid slutet av boostfasen.

De dysfel som anv¨ants vid de f¨orsta testerna ¨ar (xtot−xmc(0))Fd+Md= −3500

(52)

5.3 Prestandatester utan observat¨or 39 f¨orflyttar sig. Fd= −2500 N och ¨ar konstant. Om initiala v¨ardet f¨or totala

momen-tet v¨aljs till −3500 motsvarar detta att momentst¨orningen, Md, kommer att vara

400 Nm. I de fall d˚a styrsignalbegr¨ansningar anv¨ands ¨ar st¨orsta m¨ojliga styrsignal 0.15 radianer i vardera riktningen.

D˚a linj¨ar aerodynamik anv¨ands anses de aerodynamiska koefficienter vara linj¨ara

funktioner av robotens tillst˚and. ¨Aven mekaniska parametrar som

masscentrum-f¨orflyttningen har ansetts vara linj¨ara funktioner av tiden. Till exempel ses CN

som CNαα. D˚a den olinj¨ara aerodynamiken anv¨ands ¨ar CN en funktion av machtal

och α och i den olinj¨ara modellen ¨ar masscentrumf¨orflyttningen parameterberoen-de av tiparameterberoen-den. De olinj¨ara parametrarna ¨ar tabeller d¨ar v¨arparameterberoen-den r¨aknas fram genom interpolation. Exakt hur dessa ser ut ¨ar hemligst¨amplat och kan ej redovisas.

En simuleringsmilj¨o har byggts upp i simulink d¨ar en S-function f˚ar in alla parametrar som beh¨ovs f¨or att bygga upp A-, B-, C-, och D-matrisen. Paramet-rarna ¨ar bland annat aerodynamiska koefficienter och robotdata som, till exempel, masscentrums placering. I denna S-function s¨atts ¨aven starttillst˚anden x0. I

simu-leringsmodellen finns en observat¨or som ¨aven den beskrivs med en S-function p˚a samma s¨att som f¨or systemet.

F¨or alla tester kommer α, ˙θ och δ plottas. Slutsatser dras fr˚an plottarnas utseen-de. D˚a prestandatester redovisas plottas simuleringar f¨or H∞- och LQ-regulatorn i

samma figur. Detta f¨or att visa p˚a skillnader i prestanda. N¨ar observat¨or och/eller olinj¨ariteter anv¨ands kommer resultaten att plottas tillsammans med resultaten fr˚an ett system utan dessa f¨or¨andringar. Kurvorna har beteckningarna f¨ore och efter, d¨ar systemet f¨ore ¨ar ett s˚a kallat nominellt system. Det nominella systemet ¨ar linj¨art och tillst˚anden ¨ar k¨anda.

5.3

Prestandatester utan observat¨

or

5.3.1

Referensf¨

oljningstest utan dysfel

I figur 5.1 syns det att H∞-regulatorn inte f¨oljer referenssignalen lika bra som

LQ-regulatorn. Detta beror p˚a att H∞-regulatorn prioriterar d¨ampning framf¨or

referensf¨oljning i b¨orjan. Detta diskuterades i kapitel 4. De b˚ada styrsignalerna har i princip samma utseende under hela f¨orloppet f¨orutom att H∞-regulatorn ligger

f¨orskjuten i f¨orh˚allande till LQ-regulatorn den f¨orsta halvsekunden. D˚a referenssig-nalen ¨andras abrubt vid 0.5 och 0.75 sekunder ¨ar beteendet ungef¨ar detsamma f¨or reglersystemen. H∞-regulatorn har ett n˚agot mer oscillativt beteende. Detta syns

b¨ast om ˙θ studeras.

5.3.2

Dysfelstest med referenssignal noll

De b¨agge systemen uppf¨or sig ganska lika ¨aven vid dysfelstestet. H∞-regulatorn

sv¨anger dock mer fr˚an 0.35 sekunder fram till 0.6 sekunder. Detta syns tydligast i ˙θ:s beteende, se figur 5.2. Bytet d˚a H∞-regulatorn ska ¨overg˚ar fr˚an d¨ampning av

sv¨angningar till att f¨olja referens sker vid 0.35 sekunder. Detta syns i alla signa-lerna. Det ¨ar f¨ormodligen hoppet i styrsignalen vid 0.35 sekunder som ¨ar orsaken

References

Related documents

L˚ at y(t) vara andelen av populationen som ¨ar smittad efter tiden t dygn, r¨aknad fr˚ an uppt¨ack- ten... Observera att ¨amnets koncentration ¨ar samma som m¨angden av

D¨arf¨or ¨ar 2X exponentialf¨ordelad, med v¨antev¨arde 2a, vilket ¨ar samma f¨ordelning som f¨or Y.. Uppgiften ¨ar egentligen felformulerad; det ¨ar signifikansnniv˚an 1%

[r]

Den ovanst˚ aende bevistekniken ¨ar ett modernt p˚ afund och knepet att skapa en l¨amplig tv˚ a- dimensionell f¨ordelning

Till exempel fick jag inte med n˚ agot Ljus- och Optikland i f¨ orsta f¨ ors¨ oket, och pilen mot Kosmologi, som ligger utanf¨ or den h¨ ar kartan, borde peka mer upp˚ at,

Till sist ¨ar lampa C minst energetisk (i det infra-r¨oda bandet). Svaret ¨ar allts˚ a D→A→B→C.. b) L˚ ag energi hos fotonerna inneb¨ar l˚ ang v˚ agl¨angd, allts˚ a har

Po¨ angen p˚ a godk¨ anda duggor summeras och avg¨ or slutbetyget.. L¨ osningarna skall vara v¨ almotiverade och

Du m˚ aste inte r¨ akna ut eventuella potenser i de tv˚ a