W analizie numerycznej metoda Brenta jest metodą znajdowania pierwiastków, która łączy metodę bisekcji, metodę siecznych oraz odwrotną interpolację kwadratową. Ma niezawodność bisekcji, ale może być tak szybka jak te mniej wiarygodne metody. Algorytm próbuje użyć potencjalnie szybko zbieżnych metod jak metodę siecznych czy, jeśli to możliwe, odwrotną interpolację kwadratową, ale wraca do bardziej solidnej metody bisekcji, jeśli to konieczne. Metodę tę wymyślił Richard Brent, opierając się na wcześniejszym algorytmie Theodorusa Dekkera. W związku z tym metoda jest znana pod nazwą metody Brenta-Dekkera.
Opis
Metoda Dekkera sprawuje się dobrze, jeśli funkcja stosunkowo dobrze się zachowuje. Jednak istnieją okoliczności, w których każda iteracja wykorzystuje metodę siecznych, ale iteracje zbiegają bardzo powoli (w szczególności może być dowolnie małe). W tym wypadku metoda Dekkera wymaga znacznie więcej iteracji niż metoda bisekcji. Brent w 1973[1] zaproponował małą modyfikację, aby uniknąć tego problemu. Wstawił dodatkowy test, który musi być spełniony zanim w następnej iteracji zostanie zaakceptowany rezultat metody siecznych. Muszą być spełnione jednocześnie dwie nierówności: biorąc pod uwagę właściwą tolerancję numeryczną, jeśli poprzedni krok użył metody bisekcji, musi zostać spełniona nierówność
aby przeprowadzić interpolację. W przeciwnym przypadku wykonywana jest metoda bisekcji i jej rezultat jest użyty w następnej iteracji. Jeśli poprzedni krok wykonał interpolację, wtedy zamiast niej użyta jest nierówność
do wykonania następnej akcji (do wyboru): interpolacji (kiedy nierówność jest spełniona) lub bisekcji (kiedy nierówność nie jest spełniona). Również, jeśli w poprzednim kroku została użyta metoda bisekcji, musi być spełniona nierówność
W przeciwnym razie wykonywana jest metoda bisekcji i jej rezultat jest użyty w następnej iteracji. Jeśli natomiast w poprzednim kroku użyto interpolacji, zamiast tego użyta jest nierówność:
Modyfikacja powoduje pewność, że na k-tej iteracji krok bisekcji zostanie wykonany w najwyżej dodatkowych iteracjach, ponieważ powyższe warunki zmniejszają o połowę rozmiar kolejnego kroku interpolacji przy każdych dwóch iteracjach i po najwyżej iteracjach wielkość kroku będzie mniejsza niż które wywołuje krok bisekcji. Brent dowiódł, że jego metoda wymaga co najwyżej N2 iteracji, gdzie N oznacza ilość iteracji metody bisekcji. Jeśli funkcja dobrze się zachowuje, wtedy metoda Brenta postępuje za pomocą odwrotnie kwadratowej bądź liniowej interpolacji, co będzie powodować zbieżność ponadliniową. Co więcej, metoda Brenta używa odwrotnej interpolacji kwadratowej zamiast liniowej interpolacji (która jest użyta w metodzie siecznych). Jeśli i będą różne, to wydajność zostanie nieznacznie zwiększona. W konsekwencji następuje zmiana warunku do zaakceptowania s (wartość proponowana zarówno przez liniową interpolację, jak i odwrotną interpolację kwadratową): s powinno leżeć pomiędzy i
Algorytm
Według oryginalnego programu Brenta w Algolu[1] z poprawkami.
Brent(a, b, t) //t = zadana tolerancja, która będzie powiększana o błąd maszynowy
{
wylicz fa = f(a);
wylicz fb = f(b);
c = a; fc = fa;
d = e = b - a;
while (true)
{
if (|fc| < |fb|)
{
SWAP(b,c);
SWAP(fb,fc);
}
tol = 2 * delta(b) + t;
m = 0.5*(c - b);
if (|m| > tol && fb != 0)
{
if (|e| < tol || |fa| <= |fb|)
d = e = m; //bisekcja
else
{
s = fb / fa;
if (a == c)
{ // metoda siecznych
p = 2 * m * s;
q = 1 - s;
}
else
{ // odwrotna interpolacja kwadratowa
q = fa / fc;
r = fb / fc;
p = s*(2 * m*q*(q - r) - (b - a)*(r - 1));
q = (q - 1)*(r - 1)*(s - 1);
}
if (p > 0) q = -q; else p = -p;
s = e; e = d;
if (2 * p < 3 * m*q - |tol*q| && p < |0.5*s*q|)
d = p / q;
else
d = e = m; //bisekcja
}
a = b; fa = fb;
if (|d| > tol)
dtol = d;
else if (m > 0)
dtol = tol;
else
dtol = -tol;
b = b + dtol;
wylicz fb = f(b);
if (!DIFFSIGN(fb, fc))
{
c = a; fc = fa;
d = e = b - a;
}
}
else break;
}
return b;
}
Powyższy algorytm nie sprawdza, czy wewnątrz przedziału występuje miejsce zerowe, zatem należy upewnić się co do tego przed jego uruchomieniem.
Natomiast, jeśli miejsc zerowych jest kilka, podawane jest tylko jedno z nich.
Przykład
Dla funkcji na [3,01; 4]:
- a1 = 3,010000000000, b1 = 4,000000000000, c1 = 3,010000000000
- a2 = 4,000000000000, b2 = 3,950000000000, c2 = 3,010000000000
- a3 = 3,950000000000, b3 = 3,480000000000, c3 = 3,010000000000
- a4 = 3,480000000000, b4 = 3,245000000000, c4 = 3,010000000000
- a5 = 3,245000000000, b5 = 3,127500000000, c5 = 3,245000000000
- a6 = 3,127500000000, b6 = 3,185075000000, c6 = 3,127500000000
- a7 = 3,185075000000, b7 = 3,170992625000, c7 = 3,127500000000
- a8 = 3,170992625000, b8 = 3,166554383174, c8 = 3,170992625000
- a9 = 3,166554383174, b9 = 3,166669581069, c9 = 3,166554383174
- a10 = 3,166669581069, b10 = 3,166666668630, c10 = 3,166554383174
- a11 = 3,166666668630, b11 = 3,166666666667, c11 = 3,166666668630
- a12 = 3,166666666667, b12 = 3,166666666668, c12 = 3,166666666667
Własności
Metoda Brenta zachowuje się znacznie lepiej niż metoda Dekkera (algorytm A), jednak przewyższa ją metoda Dekkera (algorytm R). Przykładowo dla powyższej funkcji potrzeba 12 kroków (licząc z początkowym), podczas gdy metoda Dekkera R potrzebuje tylko 5 kroków.
Co więcej, gdy przetestujemy funkcję mającą zera w punktach –3 i 1 z różnymi punktami początkowymi i końcowymi na przedziale z siatką co 0.01, to dla niektórych zakresów będzie wymagane aż 69 kroków jak podczas gdy dla metody Dekkera R żaden zakres nie będzie wymagał więcej niż 14 kroków.
Przypisy