1.6. Olinj¨ ara problem

(1)

forts. p˚a föreg˚aende föreläsning:

Minsta kvadratmetoden kan ocks˚a till¨ampas p˚a funktioner som inte har ett linj¨art beroende av parametrarna.

Vi skall b¨orja med att beskriva i korthet den statistiska princip, som ligger till den grund f¨or den tidigare beskrivna minsta kvadratmetoden.

Antag, att vi ¨onskar best¨amma parametervektorn x = {xi, i = 1, 2, . . . , m} i modellekvationen y(t) = f (t, x) utg˚aende fr˚an observationerna

y_i = y(t_i) + e_i (i = 1, 2, . . . , n) (n > m),

där mätfelen ei antas vara oberoende, normalfördelade slumptal med medelvärdet 0 och standardavvikelsen σ_i.

Detta innebär, att sannolikheten för mätvärdet yi har normalfördelningen

P (y_i) = 1 σ_i√

2πexp (

−¹₂[y_i − f (t_i, x)]² σ_i²

) .

(2)

Om mätvärdena är oberoende, s˚a kommer sannolikheten för att erh˚alla en bestämd serie observationsdata y_i, i = 1, 2, . . . , n att vara produkten av de enskilda sannolikheterna

P_y = P (y₁)P (y₂) . . . .

P_y är givetvis i allmänhet en funktion av parametrarna xi (i = 1, 2, . . . , m). Genom att införa beteck- ningen

χ²(x) =

Xn i=1

1

σ_i²[y_i − f (ti, x)]², s˚a finner man, att den totala sannolikheten kan uttryckas

P_y(x) = 1

σ₁σ₂ . . . σ_n(2π)^n/2e^−χ2/2.

Enligt maximeringsprincipen (se föreläsn. 10 i kursens första del) bör parametrarna väljas s˚a, att P_y blir s˚a stor som möjligt. Detta leder till villkoret χ² = minimum, vilket är ekvivalent med minsta kvadratmetoden¹. Observera, att denna härledning bygger p˚a, att mätvärdena är normalfördelade, vilket inte alltid behöver vara fallet.

1C.F. Gauss: Theoria Motus..., Art. 179

(3)

Som ett uttryck f¨or anpassningens godhet anv¨ander man ofta testfunktionen

S = Xn

k=1

w_ke²_k = Xn

k=1

w_k[y_k − f (tk, x)]²,

istället för χ². w_k betecknar mätningarnas vikter (wk ∝ ¹

σ2k

).

I matrisform kan denna funktion uttryckas S = e⁰W e, d¨ar W ¨ar en diagonal viktsmatris (Wij = w_iδ_ij), och e en felvektor (e_i = y_i − f (t_i, x)).

Om ifr˚agavarande minsta kvadratproblem är linjärt, s˚a kan denna felvektor uttryckas i formen e = y −Ax, där A är en n × m–matris med konstanta koefficienter (observera, att n > m).

I minimet g¨aller ^∂S

∂xk = 0. Genom att till¨ampa detta villkor p˚a testfunktionen S f˚as

0 = ∂S

∂x_k = −2 Xn

i=1

w_i(y_i − Xm

j=1

A_ijx_j)A_ik,

(4)

som leder till ekvationssystemet Xn

i=1

Xm j=1

A_ikw_iA_ijx_j = Xn

i=1

A_ikw_iy_i (k = 1, 2, . . . , n)

(Gauss’ normalekvationer).

Dessa ekvationer kan ocks˚a framst¨allas i matrisform

A⁰W Ax = A⁰W y.

Om matrisen A⁰W A (som är en symmetrisk m × m–matris) inte är singulär, s˚a är x₀ = (A⁰W A)⁻¹A⁰W y

en stationär punkt av S. Denna matris är relaterad till Hesses matris (efter Otto Hesse, 1811-1874) för S, som är H = 2A⁰W A. Man kan visa, att x₀ är ett minimiställe, ifall H är positivt definit. Detta är analogt med det endimensionella fallet där x0 är ett minimiställe, om f⁰(x₀) = 0 och f⁰⁰(x₀) > 0.

Ifall f beror olinjärt av x, s˚a kan minsta kvadratproblemet (i princip) lösas genom successiva approxima- tioner, där man vid varje steg löser ett linjärt minsta kvadratproblem.

(5)

1.6. Olinj¨ ara problem

Det förekommer ofta, att man vill bestämma värdet av parametrar, som p˚a ett olinjärt sätt beror av mätbara storheter. Vi har t.ex. en kemisk reaktion, där jonkoncentrationen vid en viss tidpunkt t antar ett värde som kan uttryckas i formen f (t) = 10e^−3t + 2e^−5t. Antag, att vi vill veta när jonkoncentrationen nedg˚att till hälften av sitt ursprungliga värde. Emedan f (0) = 12, s˚a kan kan vi bestämma denna tidpunkt ur ekvationen f (t) = 6, dvs den är ett nollställe för funktionen 10e^−3t+2e^−5t−6 (t.ex. t ≈ 0.211327).

Vi skall därför studera iterativa metoder att bestämma rötter, och börjar med kvadratroten ur ett positivt tal a. Geometriskt kan problemet tolkas s˚a, att det gäller att konstruera en kvadrat, vars yta är a. Vi kan göra det s˚a, att vi först gissar en rot, som vi t.ex. kallar x₀. En rektangel med sidorna x₀ och a/x₀ har d˚a ytan a. För att f˚a rektangeln att mera likna en kvadrat, kan vi t.ex. räkna ut medeltalet av x0 och a/x₀: x₁ = ¹₂(x₀ + â

x0), och v¨alja detta till sida i en ny rektangel, och upprepa konstruktionen. Till slut f¨orvandlas rektangeln till en kvadrat (hoppas vi).

(6)

Vi kan l¨att skriva ett litet MATLAB–program som testar metoden:

>> a=5000;

>> x0=60;

>> for i=1:5

x1 = (x0 + a/x0)/2;

disp(sprintf(’%2.0f %17.14f’,i,x1)) x0 = x1;

end

1 71.66666666666666 2 70.71705426356590 3 70.71067840610468 4 70.71067811865476 5 70.71067811865476

Som synes, konvergerar den rätt snabbt. Hur kan man konstruera ett bra utg˚angsvärde för rotiterationerna?

Det är lätt att se, att iterationsintervallet kan betydligt förminskas. Om vi uttrycker a i formen a = p · 4^k,

1

4 < p < 1, d¨ar k ¨ar ett heltal, s˚a kan kvadratroten skrivas √

a = √

p · 2^k. Vi har allts˚a reducerat problemet till att beräkna kvadratroten för ett tal inom intervallet [0.25, 1]. Ett bra utg˚angsvärde för det reducerade kvadratrotsproblemet är därför L(p) = (1 + 2p)/3, eftersom denna funktion interpolerar f (p) = √

p i punkterna p = 0.25 och p = 1. Dessutom kan man visa, att |L(p) − √

p| ≤ 0.05 f¨or alla v¨arden av p inom detta intervall.

(7)

En uppskattning av felet efter k iterationer f˚ar vi ur ekvationen

x₁ − √

p = ¹₂

x₀ + p x₀

− √

p = ¹₂

x₀ − √

√ p x₀

² .

Antag, att x₀ = L(p) är utg˚angsvärdet och xk värdet efter den k:te iterationen. Om felet är ek = x_k −√

p, s˚a följer av ekvationen ovan att e_k+1 = e²_k/(2x_k). Man kan ocks˚a visa, att uppskattningarna x_k alltid befinner sig inom intervallet [0.5, 1], s˚a att e_k+1 ≤ e²_k. Härav följer, att e₄ ≤ e²₃ ≤ e⁴₂ ≤ e⁸₁ ≤ e¹⁶₀ ≤ 0.05¹⁶, varför fyra steg räcker till för 16 siffors noggrannhet.

Programmet ovan kan d˚a modifieras p˚a följande sätt (dock inte s˚a noggrannt för sm˚a värden av a)

>> a=5000;p=a; k=0;

>> while p>1 p=p/4;

k=k+1;

end

>> x0=(1+2*p)/3;

>> for i=1:5

x1=(x0+p/x0)/2; x=x1*2^k;

disp(sprintf(’%2.0f %17.14f’,i,x)) x0=x1;

end

(8)

1 70.73985496260360 2 70.71068413568874 3 70.71067811865501 4 70.71067811865476 5 70.71067811865476

En vanlig metod för att söka rötter är bisektionsmetoden. Den bygger p˚a satsen, att om en kontinuerlig funktion byter sitt förtecken inom ett intervall, s˚a m˚aste den ha minst en rot inom intervallet. Detta resultat kan användas för att begränsa roten inom allt snävare gränser. Antag, att funktionens värden i intervallets

ändpunkter uppfyller villkoret f (a)f (b) ≤ 0 och att intervallets mittpunkt är m = (a + b)/2. D˚a gäller antingen f (a)f (m) ≤ 0 eller f (m)f (b) ≤ 0. I det förstnämnda fallet vet vi att det finns en rot i intervallet [a, m], i det senare fallet vet vi att det finns en rot i intervallet [m, b]. Halveringsprocessen kan fortsättas, tills vi n˚att en p˚a förhand bestämd toleransgräns delta:

while abs(a-b) > delta if f(a)*f((a+b)/2) <= 0

b = (a+b)/2;

else

a = (a+b)/2;

end end

rot = (a+b)/2;

(9)

Programmet är n˚agot bristfälligt, för det kan hända, att while–slingan aldrig avslutas, om delta är mindre

än det tal, som anger räknenoggrannheten. Vi kan korrigera detta genom att förändra while–satsen till while abs(a-b) > delta + eps*max(abs(a), abs(b)).

Därigenom garanteras, att slingan avslutas, även om delta är för litet. Dessutom använder programmet tv˚a funktionsberäkningar vid varje iteration. Följande program är en förbättrad version av bisektionsmetoden:

function rot = bisect(fname,a,b,delta)

% Invariabler:

% fname funktionens (f(x)) namn

% a,b intervallet [a,b] d¨ar

% f ¨ar kontinuerlig, f(a)f(b) < 0

% delta icke-negativt reellt tal.

% Utvariabel:

% rot mittpunkten av ett intervall [a1,b1]

% f¨or vilket f(a1)f(b1)<=0 och

% |b1-a1| <= delta + eps*max(|a1|,|b1|) fa = feval(fname,a);

fb = feval(fname,b);

if fa*fb > 0

disp(’Roten ¨ar utanf¨or intervallet’) return

end

(10)

if nargin==3 delta = 0;

end

while abs(a-b) > delta+eps*max(abs(a),abs(b)) mid = (a+b)/2;

fmid = feval(fname,mid);

if fa*fmid<=0

% Det finns en rot innanf¨or [a,mid].

b = mid;

fb = fmid;

else

% Det finns en rot innanf¨or [mid,b].

a = mid;

fa = fmid;

end end

rot = (a+b)/2;

Största delen av tiden i programmet bisect ˚atg˚ar till att beräkna funktionsvärden.

Felet i bisektionsmetoden minskar med hälften vid varje steg. Om det k:te intervallet betecknas [ak, b_k], s˚a är |ak − b_k| ≤ |a₀ − b₀|/2^k varför iterationsprocessen alltid konvergerar.

(11)

Om x_k = (a_k + b_k)/2 är den k:te approximationen till roten, s˚a gäller för roten x_∗ villkoret

|xk − x∗| ≤ |ak − bk|

2 ≤ |a0 − b0| 2^k+1 .

Man säger att en räcka xk konvergerar linjärt mot x∗ om det finns en s˚adan konstant c, 0 ≤ c < 1 och ett heltal k₀ att |x_k+1 − x_∗| ≤ c|x_k − x_∗| för alla k ≥ k₀ (c = 1/2 i detta fall). Vi kan tillämpa bisect p˚a funktionen f (x) = tan(x/4) − 1 och sätta [a0, b₀] = [2, 4]:

a a_k b_k a_k - b_k

0 2.00000000000000 4.00000000000000 2.00000000000000 1 3.00000000000000 4.00000000000000 1.00000000000000 2 3.00000000000000 3.50000000000000 0.50000000000000 3 3.00000000000000 3.25000000000000 0.25000000000000 4 3.12500000000000 3.25000000000000 0.12500000000000 5 3.12500000000000 3.18750000000000 0.06250000000000 6 3.12500000000000 3.15625000000000 0.03125000000000

. . . .

43 3.14159265358967 3.14159265358990 0.00000000000023 44 3.14159265358978 3.14159265358990 0.00000000000011 45 3.14159265358978 3.14159265358984 0.00000000000006 46 3.14159265358978 3.14159265358981 0.00000000000003 47 3.14159265358978 3.14159265358980 0.00000000000001 48 3.14159265358979 3.14159265358980 0.00000000000001 49 3.14159265358979 3.14159265358980 0.00000000000000

(12)

Som vi ser, är konvergensen inte särskilt snabb. Det behövs ca tre iterationer för att beräkna en ny siffra i π.

Med Newtons metod kan man beräkna nollställen betydligt snabbare. Antag, att vi känner värdet av en funktion f (x) och dess derivata f⁰(x) i en punkt x = x_c. Tangenten till kurvan i denna punkt

L(x) = f (x_c) + (x − x_c)f⁰(x_c)

kan uppfattas som en linj¨ar approximation f¨or kurvan i denna punkt (se figuren).

Nollstället x0 för L(x) kan d˚a beräknas ur ekvationen

x₀ = x_c − f (x_c) f⁰(x_c).

(13)

Genom att upprepa denna formel f˚ar man en algoritm, som beskrivs genom f¨oljande MATLAB–program:

xc = input(’Ange begynnelsev¨ardet:’);

fc = feval(fname,xc);

dfc = feval(dfname,xc);

while input(’Nytt Newton-steg? (0=nej, 1=ja)’);

xnew = xc - fc/dfc;

xc = xnew;

fc = feval(fname,xc);

dfc = feval(dfname,xc);

end

Programmet förutsätter, att fname och dfname är strängar, som inneh˚aller funktionsnamnet, resp.

derivatans namn. Om vi använder Newtons metod för att beräkna nollstället för f (x) = tan(x/4) − 1 f˚ar vi en mycket snabbare konvergens än med bisektionsmetoden:

k x_k |x_k - pi|

0 1.00000000000000 2.14159265358979 1 3.79631404657234 0.65472139298255 2 3.25943543617547 0.11784278258568 3 3.14513155420752 0.00353890061772 4 3.14159578639006 0.00000313280027 5 3.14159265359225 0.00000000000245 6 3.14159265358979 0.00000000000000

(14)

Som vi ser, verkar felet att bli kvadrerat efter ett visst antal iterationer. En s˚adan metod s¨ags konvergera kvadratiskt. I detta fall finns det ett heltal k₀ och en positiv konstant c som uppfyller villkoret

|x_k+1 − x_∗| ≤ c|x_k − x_∗|²

f¨or alla k ≥ k₀.

Newtons metod är dock inte alltid särskilt stabil. Om t.ex. derivatans värde i nollstället f⁰(x_∗) är mycket litet, s˚a är tangenten nästan parallell med x–axeln, och det blir sv˚art att beräkna nollstället noggrant. Om f⁰(x_c) är litet i förh˚allande till f (x_c), s˚a kan korrektionen till roten bli alltför stor, och Newton–steget för oss alltför l˚angt bort fr˚an nollstället. Ett typiskt exempel är f (x) = arctan(x). Newton–korrektionen till roten är i detta fall x0 = x_c − (1 + x²_c) arctan(x_c). Man kan visa, att om |x_c| > 1.3917, s˚a är |x0| > |xc|. Detta betyder, att iterationerna divergerar om utg˚angsvärdet är utanför intervallet [−1.3917, 1.3917]. Vi kan härav dra den slutsatsen, att funktionen f inte kan vara alltför olinjär, och f⁰ inte alltför nära noll, om Newtons metod skall fungera.

Man kan visa, att om f⁰ inte ändrar förtecken i närheten av x∗, om f inte är alltför olinjär, och om Newton–

iterationerna p˚abörjas tillräckligt nära ett nollställe, s˚a garanteras en kvadratisk konvergens. Att avsluta en Newton–process är inte alldeles lätt, eftersom man inte vet hur nära minimet man kommit. En möjlighet

är att sluta d˚a |xk+1 − xk| är tillräckligt litet, eftersom av lim xk = x_∗ följer lim |x_k+1 − xk| = 0.

(15)

Detta gäller dock inte omvänt. Om t.ex. f (x) = tan x och xc = π/2 − 10⁻⁵, s˚a är |x0 − xc| = tan x/(1 + tan² x) ≈ 10⁻⁵ fastän den närmaste roten är x = 0.

För att bemästra dessa problem kan man kombinera Newtons metod med bisektionsmetoden. I början av varje steg kontrolleras först att roten befinner sig innanför intervallet [a, b], och att x_c är en av intervallets

¨

andpunkter. Om punkten

x₀ = x_c − f (x_c) f⁰(x_c)

hör till intervallet [a, b], s˚a är allt ok, och vi fortsätter med att behandla antingen [a, x0] eller [x₀, b].

Därp˚a sätts xc lika med x₀. Om Newton–steget för oss bort fr˚an intervallet [a, b], s˚a gör vi ett bisektionssteg, och sätter xc till (a + b)/2. För att kontrollera om Newton–steget h˚alls innanför intervallet [a, b]

anv¨ander vi funktionen

function ok = stegin(x,fx,dfx,a,b)

% Invariabler:

% x v¨ardet av x.

% fx v¨ardet av f i x.

% dfx v¨ardet av f’ i x.

% a,b anger intervallet [a,b]

% Utvariabel:

% ok 1 om Newton-steget x - fx/dfx h˚alls inom [a,b]

% 0 om inte.

(16)

if dfx > 0

ok = ((a-x)*dfx <= -fx) & (-fx <= (b-x)*dfx);

elseif dfx < 0

ok = ((a-x)*dfx >= -fx) & (-fx >= (b-x)*dfx);

else

ok = 0;

end

För att försäkra oss om att iterationerna tar slut, används de tre följande konvergensvillkoren:

- Längden av intervallet som granskas skall vara mindre än tolx, som är en bestämd tolerans. Roten kommer d˚a inte att skilja sig fr˚an en riktig rot mer än tolx.

- Absoluta värdet av f (xc) är mindre eller lika med tolf, vilket inte behöver betyda att x_c är nära en riktig rot.

- Antalet funktionsberäkningar överskrider ett positivt tal nEvalsMax. Detta innebär att de b˚ada tidigare nämnda villkoren inte är uppfyllda.

H¨ar ¨ar det slutliga programmet:

(17)

function [x,fx,nEvals,aF,bF] = newton(fName,dfName,a,b,tolx,tolf,nEvalsMax)

% Invariabler:

% fName namnet p˚a funktionen f(x).

% dfName namnet p˚a derivatafunktionen f’(x).

% a,b roten till f(x) s¨oks inom intervallet [a,b]

% och f(a)*f(b)<=0.

% tolx,tolf avslutningskriterier.

% nEvalsMax maximiantalet derivataber¨akningar.

% Utvariabler:

% x Ett approximativt nollst¨alle f¨or f.

% fx V¨ardet av f i x.

% nEvals Antalet derivataber¨akningar som beh¨ovdes.

% aF,bF Det slutliga intervallet [aF,bF].

fa = feval(fName,a);

fb = feval(fName,b);

if fa*fb>0

disp(’Roten inte innanf¨or intervallet’) return

end x = a;

fx = feval(fName,x);

dfx = feval(dfName,x);

disp(sprintf(’%20.15f %20.15f %20.15f’,a,x,b)) nEvals = 1;

while (abs(a-b)>tolx)&(abs(fx)>tolf)&((nEvals<nEvalsMax)|(nEvals==1))

%roten inom [a,b] och x = a eller x = b.

if stegin(x,fx,dfx,a,b)

%Ett Newton-steg:

disp(’Newton’)

(18)

x = x-fx/dfx;

else

%Ett bisektionssteg:

disp(’Bisektion’) x = (a+b)/2;

end

fx = feval(fName,x);

dfx = feval(dfName,x);

nEvals = nEvals+1;

if fa*fx<=0

% En rot inom [a,x]. Välj x till höger ändpunkt.

b = x;

fb = fx;

else

% En rot inom [x,b]. Välj x till vänster ändpunkt.

a = x;

fa = fx;

end

disp(sprintf(’%20.15f %20.15f %20.15f’,a,x,b)) end

aF = a;

bF = b;

Detta program utför normalt ett antal bisektionssteg innan Newton–iterationerna börjar. Här är resultatet, d˚a man beräknar ett nollställe för f (x) = sin(x) inom intervallet [−7π/2, 15π + 0.1]:

(19)

Stegtyp a x b

-10.995574287564276 -10.995574287564276 47.223889803846896 Bisektion -10.995574287564276 18.114157758141312 18.114157758141312 Bisektion -10.995574287564276 3.559291735288517 3.559291735288517 Newton 3.115476144648328 3.115476144648328 3.559291735288517 Newton 3.115476144648328 3.141598592990409 3.141598592990409 Newton 3.141592653589793 3.141592653589793 3.141598592990409

Vi skall nu i korthet diskutera minimering av funktioner. Som ett exempel kan vi v¨alja v¨axelverkningspo- tentialen mellan Na⁺ och Cl⁻ jonerna i en NaCl–molekyl, som kan beskrivas av modellfunktionen

V (r) = − e²

4π₀r + αe^−r/ρ,

där e är elektronladdningen, och α = 1.09 · 10³eV och ρ = 0.330˚A är tv˚a parametrar, som beskriver växelverkan mellan jonerna. Om vi substituerar x = r/ρ och sätter in talvärden, s˚a kan funktionen skrivas sortlöst i formen

f (x) = −0.04

x + e^−x ≡ V (r) α .

Denna funktion har ett minimum, som anger bindningslängden för molekylen NaCl. Detta är ett exempel p˚a ett endimensionellt optimeringsproblem. Funktionen f , som vi försöker optimera kallas objektivfunktionen.

(20)

Ett enkelt sätt att studera en dylik funktion, är att upprita den och studera grafen för att finna minimet.

Newtons metod, tillämpad p˚a ekvationen f⁰(x) = 0, är en effektiv metod, ifall vi lätt kan beräkna funktionens derivator, och vi känner en god approximation för minimet. Det finns ocks˚a enkla metoder att beräkna ett minimum för en endimensionell funktion, där man inte behöver beräkna derivator.

En av dessa baserar sig p˚a det gyllene snittet och kan tillämpas p˚a unimodala funktioner. En funktion f (x) sägs vara unimodal inom ett givet intervall [a, b], om det finns en punkt x_∗ inom detta intervall, s˚a att funktionen är strängt monotont avtagande inom [a, x∗] och strängt monotont växande inom [x∗, b], dvs den har endast ett minimum inom intervallet.

Vi antar vidare, att vi har beräknat funktionsvärdena i fyra punkter a1, a₂, a₃ och a₄, och att vi p˚a grund av detta vet att minimet befinner sig inom intervallet (a₁, a₄) (vi antar dessutom, att a₁ < a₂ < a₃ < a₄ gäller). Utg˚angsvärdena kan bestämmas genom att man beräknar funktionsvärdet i en viss punkt, och därp˚a ger ett tillskott till argumentet tills funktionen börjar växa. Om detta inte sker, g˚ar man i motsatt riktning.

(21)

Antag nu, att dessa fyra a–v¨arden uppfyller ekvationerna a3 − a₁ = a₄ − a₂ = γ(a₄ − a₁), d¨ar γ = 2/(1 + √

5) ≈ 0.618034 . . .. Genom att testa funktionsvärdena f (a₁), f (a₂), . . . , f (a₄) är det möjligt att f˚a reda p˚a inom vilket av de tv˚a lika stora intervallen (a₁, a₃) eller (a₂, a₄) minimet ligger.

Vi kan för enkelhetens skull anta att det ligger inom intervallet (a₁, a₃). Funktionen beräknas därp˚a i en ny punkt a₅, som uppfyller villkoret a₅ − a1 = a₃ − a2. I detta fall gäller a3 − a5 = γ(a₃ − a1). Vi inser detta, om γ⁻¹ = γ + 1 tillämpas i formeln ovan, varp˚a vi f˚ar a₄ − a1 = γ(a₃ − a1) + a₃ − a1, dvs γ(a₃ − a₁) = a₄ − a₃ = a₂ − a₁ = a₃ − a₅. Om vi nu betecknar punkterna a⁰₁ = a₁, a⁰₂ = a₅, a⁰₃ = a₂ och a⁰₄ = a₃, s˚a finner vi situationen motsvara utg˚angspunkten med undantag av att intervallängden reducerats med beloppet γ: a⁰₄ − a⁰₁ = γ(a₄ − a₁). Som av bilden framg˚ar, kommer allts˚a minimet att inneslutas mellan allt tr˚angare gränser.

(22)

Gyllene snitt–metoden konvergerar linjärt, liksom bisektionsmetoden. Newtons metod är snabb, men den tillämpas p˚a derivatans nollställe s˚a man behöver b˚ade första och andra derivatan. MATLAB–funktionen fminbnd kombinerar gyllene snitt–metoden med en parabolisk metod, som inte behöver derivator.

Vi kan prova funktionen fminbnd p˚a potentialfunktionen f¨or NaCl molekylen:

function y = nacl(x)

y = -0.04./x + exp(-x);

Funktionen faller ganska brant, har ett maximum n¨ara 0.2, passerar x–axeln, och n¨armar sig x–axeln p˚a nytt fr˚an negativa sidan. Om minimet antas vara i intervallet [4, 10] n˚ar vi det efter 13 iterationer:

>> xmin=fminbnd(’nacl’,4,10,optimset(’TolX’,1e-14,’Display’,’iter’))

Func-count x f(x) Procedure

1 6.2918 -0.00450605 initial

2 7.7082 -0.00474015 golden

3 8.58359 -0.0044729 golden

4 7.40247 -0.00479386 parabolic

5 7.2692 -0.004806 parabolic

6 6.89587 -0.00478862 golden

7 7.1682 -0.00480949 parabolic

8 7.14704 -0.00480953 parabolic

9 7.15417 -0.00480955 parabolic

...

13 7.1543 -0.00480955 parabolic

Bindningslängden för NaCl är allts˚a r = 0.33 · 7.1543˚A = 2.3609˚A.