Алгоритм Гаусса — Ньютона

Приближение кривой со случайным шумом асимметричной моделью пика используя алгоритм Гаусса — Ньютона с переменным коэффициентом затухания α.
Сверху: необработанные данные и модель.
Снизу: ход нормализованной суммы квадратов ошибок.

Алгоритм Гаусса — Ньютона используется для решения задач нелинейным методом наименьших квадратов[англ.]. Алгоритм является модификацией метода Ньютона для нахождения минимума функции. В отличие от метода Ньютона, алгоритм Гаусса — Ньютона может быть использован только для минимизации суммы квадратов, но его преимущество в том, что метод не требует вычисления вторых производных, что может оказаться существенной трудностью.

Задачи, для которых применяется нелинейный метод наименьших квадратов, возникают, например, при нелинейной регрессии, в которой ищутся параметры модели, которые наиболее соответствуют наблюдаемым величинам.

Метод назван именами математиков Карла Фридриха Гаусса и Исаака Ньютона.

Описание

Если задано m функций r = (r1, …, rm) (часто называемых невязками) от n переменных β = (β1, …, βn), при m ≥ n. Алгоритм Гаусса — Ньютона итеративно находит значения переменных, которые минимизируют сумму квадратов[1]

Начав с некоторого начального приближения , метод осуществляет итерации

Здесь, если рассматривать r и β как вектор-столбцы, элементы матрицы Якоби равны

а символ означает транспонирование матрицы.

Если m = n, итерации упрощаются до

,

что является прямым обобщением одномерного метода Ньютона.

При аппроксимации данных, где целью является поиск параметров β, таких, что заданная модель функций y = f(x, β) наилучшим образом приближает точки данных (xi, yi), функции ri являются остаточными ошибками[англ.]

Тогда метод Гаусса — Ньютона можно выразить в терминах якобиана Jf функции f

Заметим, что является псевдообратной матрицей к .

Замечания

Требование m ≥ n в алгоритме необходимо, поскольку в другом случае матрица JrTJr не имеет обратной и нормальные уравнения нельзя решить (по меньшей мере однозначно).

Алгоритм Гаусса — Ньютона можно получить с помощью линейного приближения вектора функций ri. Используя теорему Тейлора, мы можем для каждой итерации записать:

,

где . Задача нахождения Δ, минимизирующего сумму квадратов в правой части, т.е.

,

является линейной задачей нахождения наименьших квадратов, которую можно решить явно, что даёт нормальные уравнения.

Нормальные уравнения — это m линейных уравнений по неизвестным приращениям Δ. Уравнения могут быть решены за один шаг, если использовать разложение Холецкого, или, лучше, QR-разложение матрицы Jr. Для больших систем итеративный метод может оказаться более эффективным, если используются такие методы, как метод сопряжённых градиентов. Если имеется линейная зависимость столбцов матрицы Jr, метод итераций завершается неудачей, поскольку JrTJr становится вырожденной.

Пример

Вычисленная кривая с и (синим цветом) и наблюдаемые данные (красным цветом).

В этом примере используется алгоритм Гаусса — Ньютона для построения модели данных путём минимизации суммы квадратов отклонений данных и модели.

В экспериментальной биологии изучение связей между концентрацией субстрата [S] и скоростью реакции в реакции энзимомодуляции, были получены следующие данные.

i 1 2 3 4 5 6 7
[S] 0.038 0.194 0.425 0.626 1.253 2.500 3.740
скорость 0.050 0.127 0.094 0.2122 0.2729 0.2665 0.3317

Нужно найти кривую (функцию-модель) вида

скорость ,

которая приближает наилучшим образом данные в смысле наименьших квадратов с параметрами и , которые следует найти.

Обозначим через и значения [S] и скорость из таблицы, . Пусть и . Мы будем искать и , такие, что сумма квадратов отклонений

минимальна.

Якобиан вектора остатков по неизвестным — это матрица с -ой строкой, имеющей элементы

Начав с начального приближения и после пяти итераций алгоритм Гаусса — Ньютона даёт оптимальные значения и . Сумма квадратов остатков уменьшается от начального значения 1.445 до 0.00784 к пятой итерации. График справа показывает кривую с оптимальными параметрами.

Сходимость

Можно показать[2], что направление увеличения Δ является направлением спуска[англ.] для S, и, если алгоритм сходится, пределом будет стационарная точка для S. Однако сходимость не гарантируется, даже когда начальная точка близка к решению[англ.], что происходит в методе Ньютона[англ.] или методе BFGS при обычных условиях Фольфе[3].

Скорость сходимости алгоритма Гаусса — Ньютона близка к квадратичной[4]. Алгоритм может сходиться медленнее или не сходиться совсем, если начальное приближение далеко от минимального или если матрица плохо обусловлена. Например, представим задачу с уравнениями и переменной

Полученное оптимальное решение — . (Настоящий оптимум — для , поскольку , в то время как .) Если , то задача, фактически, линейна и метод находит решение за одну итерацию. Если |λ| < 1, то метод сходится линейно и ошибка убывает со скоростью |λ| на каждой итерации. Однако, если |λ| > 1, то метод не сходится даже локально[5].

Алгоритм на основе метода Ньютона

Далее предполагается, что алгоритм Гаусса — Ньютона основан на методе Ньютона[англ.] для минимизации функции с помощью аппроксимации. Как следствие, скорость сходимости алгоритма Гаусса — Ньютона может быть квадратична, если выполнены некоторые условия. В общем случае (при более слабых условиях), скорость сходимости может оказаться линейной[6].

Рекуррентное отношение метода Ньютона для минимизации функции S от параметров

где g означает вектор-градиент функции S, а H обозначает гессиан функции S. Поскольку , градиент задаётся равенством

Элементы гессиана вычисляются путём дифференцирования элементов градиента по

Метод Гаусса — Ньютона получается путём отбрасывания второй производной (второго члена в выражении). То есть гессиан аппроксимируется

,

где — элементы якобиана Jr. Градиент и приближённый гессиан можно записать в матричной нотации

Эти выражения подставляются в рекуррентное отношение выше для получения операционных уравнений

Сходимость метода Гаусса — Ньютона в общем случае не гарантирована. Аппроксимация

,

которая должна выполняться для возможности отбрасывания членов со второй производной, может быть получена в двух случаях, для которых сходимость ожидается[7]

  1. Значения функции малы по величине, по меньшей мере, рядом с минимумом.
  2. Функции лишь "слегка" нелинейны, то есть относительно малы по величине.

Улучшенные версии

В методах Гаусса — Ньютона сумма квадратов остатков S может не уменьшаться на каждой итерации. Однако, поскольку Δ направлен в сторону уменьшения функции, если не является стационарной точкой, выполняется неравенство для достаточно малых . Таким образом, если обнаруживается расходимость, можно использовать долю вектора приращения Δ в формуле обновления:

.

Другими словами, вектор приращения слишком длинный, но он указывает направление «спуска», так что если пройти лишь часть пути, можно уменьшить значение функции S. Оптимальное значение может быть найдено с помощью алгоритма одномерного поиска[англ.], то есть величина определяется путём нахождения значения, минимизирующего S с помощью одномерного поиска[англ.] на интервале .

В случаях, когда в направлении вектора приращения оптимальная доля близка к нулю, альтернативным методом отработки расходимости является использование алгоритма Левенберга — Марквардта, известного также как «метод доверительных областей»[1]. Нормальные уравнения, модифицированные таким образом, что вектор спуска поворачивается в направлении наискорейшего спуска,

,

где D — положительная диагональная матрица. Заметим, что если D является единичной матрицей E и , то . Таким образом, направление Δ приближает направление отрицательного градиента .

Так называемый параметр Марквардта может также быть оптимизирован путём линейного поиска, но смысла особого нет, поскольку вектор сдвига нужно каждый раз пересчитывать, когда меняется . Более эффективная стратегия такая. Если обнаруживается расхождение, увеличиваем параметр Марквардта, пока S убывает. Затем сохраняем значение между итерациями, но уменьшаем его, если возможно, пока не достигнем значения, когда параметр Марквардта не может быть обнулён. Минимизация S тогда становится стандартной минимизацией Гаусса — Ньютона.

Оптимизация больших задач

Для оптимизации большого размера метод Гаусса — Ньютона особенно интересен, поскольку часто (хотя, определённо, не всегда) матрица более разрежена, чем приближённый гессиан . В таких случаях шаг вычисления сам по себе, обычно, требует применения итеративного приближённого метода, такого как метод сопряжённых градиентов.

Чтобы этот подход работал, необходим как минимум эффективный метод вычисления произведения

для некоторого вектора p. Для хранения разреженной матрицы практично хранить строки матрицы в сжатом виде (т.е. без нулевых элементов), что делает прямое вычисление приведённого выше произведения (ввиду транспозиции) сложным. Однако, если определить ci как строку i матрицы , выполняется следующее отношение:

так что любая строка делает вклад в произведение аддитивно и независимо. Кроме того, это выражение хорошо изучено для применения параллельных вычислений. Заметим, что любая строка ci является градиентом соответствующей невязки ri. При учёте этого обстоятельства вышеприведённая формула подчёркивает факт, что невязки вносят вклад в результат независимо друг от друга.

Связанные алгоритмы

В квазиньютоновских методах, таких как методы Дэвидона, Флетчера и Пауэлла[англ.] или Бройдена — Флетчера — Голдфарба — Шэнно (метод БФГШ) приближение полного гессиан строится с помощью первых производных так, что после n уточнений метод по производительности близок к методу Ньютона. Заметим, что квазиньютоновские методы могут минимизировать вещественные функции общего вида, в то время как методы Гаусса — Ньютона, Левенберга — Марквардта и т.д. применимы только к нелинейным задачам наименьших квадратов.

Другой метод решения задач минимизации, использующий только первые производные, это метод градиентного спуска. Однако этот метод не принимает во внимание вторые производные, даже приблизительные. Как следствие, метод крайне малоэффективен для многих функций, особенно в случае сильного взаимного влияния параметров.

Примечания

  1. 1 2 Björck, 1996.
  2. Björck, 1996, с. 260.
  3. Mascarenhas, 2013, с. 253–276.
  4. Björck, 1996, с. 341, 342.
  5. Fletcher, 1987, с. 113.
  6. Gratton, Lawless, Nichols.
  7. Nocedal, Wright, 1999, с. 259-262.

Литература

  • A. Björck. Numerical methods for least squares problems. — Philadelphia: SIAM, 1996. — ISBN 0-89871-360-9.
  • Roger Fletcher. Practical methods of optimization. — 2nd. — New York: John Wiley & Sons, 1987. — ISBN 978-0-471-91547-8.
  • Walter F. Mascarenhas. The divergence of the BFGS and Gauss Newton Methods // Mathematical Programming. — 2013. — Т. 147, вып. 1. — doi:10.1007/s10107-013-0720-6.
  • S. Gratton, A.S. Lawless, N.K. Nichols. Approximate Gauss-Newton methods for nonlinear least squares problems. NUMERICAL ANALYSIS REPORT 9/04 (англ.). The University of Reading (январь 2007). Дата обращения: 20 июля 2017. Архивировано из оригинала 4 августа 2016 года.
  • Jorge Nocedal, Stephen J. Wright. Numerical optimization / Peter Glynn, Stephen M. Robinson. — New York: Springer, 1999. — (Springer Series in Operations Research). — ISBN 0-387-98793-2.

Ссылки

Реализации

  • Artelys Knitro. Система для решения нелинейных задач с импленментацией метода Гаусса — Ньютона. Система написана на C и имеет интерфейсы для C++/C#/Java/Python/MATLAB/R.


Read other articles:

Le Système bulgare officiel de translittération des caractères cyrilliques (SBOTCC) (en bulgare : Обтекаема система, littéralement « système aérodynamique », c'est-à-dire au sens figuré « simplifié »)[1],[2] a été officiellement adopté par le gouvernement bulgare en 2000[3],[4],[5] et 2006[6], et est devenu la base de la loi bulgare sur la translittération en 2009[7],[8]. À la demande des autorités bulgares, ce nouveau système a ét...

 

 

  لمعانٍ أخرى، طالع جيمس غوردون (توضيح). جيمس غوردن James Gordon الظهور الأول باتمان الظهور الأول في القصص المصورة باتمان المبتكر نيل هاميلتون،  وبنيامين ماكنزي،  ولايل تالبوت،  وبات هنغل،  وغاري أولدمان،  وجي كي سيمونز،  وجيفري رايت  الصوت بواسطة بالعربية...

 

 

Les confins militaires, marches militaires, frontières militaires (en roumain Graniţa militară, en allemand Militärgrenze, en croate et serbe latin Vojna Krajina, en serbe cyrillique Војна Крајина) désignent la zone militarisée créée par les Habsbourg le long de leurs frontières avec l'Empire ottoman après le Traité de Belgrade (1739). Géographie Carte des confins militaires habsbourgeois au nord de la Bosnie, de la Serbie, et dans le Banat. Les confins militaires comp...

Grand Prix Sepeda Motor F.I.M. musim 1960 Sebelum: 1959 Sesudah: 1961 John Surtees (foto tahun 1958) mempertahankan gelar Kejuaraan Dunia 350cc dan 500cc, gelar terakhirnya di balap motor sebelum pindah ke Formula Satu. Di musim terakhirnya, Carlo Ubbiali sukses mempertahankan gelar Juara Dunia 125cc dan 250cc. Grand Prix Sepeda Motor musim 1960 adalah musim ke-12 Grand Prix Sepeda Motor F.I.M.. Musim terdiri dari tujuh balapan Grand Prix di lima kelas: 500cc, 350cc, 250cc, 125cc dan Sidecar...

 

 

Venezuelan footballer (born 1988) In this Spanish name, the first or paternal surname is Rincón and the second or maternal family name is Hernández. Tomás Rincón Rincón lining up for Venezuela in 2019Personal informationFull name Tomás Eduardo Rincón Hernández[1]Date of birth (1988-01-13) 13 January 1988 (age 36)Place of birth San Cristóbal, VenezuelaHeight 1.77 m (5 ft 10 in)[2]Position(s) Defensive midfielderTeam informationCurrent team S...

 

 

Fantasy book series This article is about the Redwall series of novels. For the first book in the series, see Redwall (novel). For other uses, see Redwall (disambiguation). RedwallSee list of books in seriesAuthorBrian JacquesTranslatorVariousIllustratorVariousCover artistVariousCountryUnited KingdomLanguageEnglishGenreChildren's, Fantasy novelMedia typePrint (Hardback & Paperback) Redwall is a series of children's fantasy novels by British writer Brian Jacques, published from 1986 to 201...

British housebuilding company Charles Church Developments LimitedFormerlyRitzvale Limited (1974–1981)Charles Church Southern Limited (1981–1995)[1]Company typePrivate limited companyIndustryHousebuildingFounded1965; 59 years ago (1965)FoundersCharles and Susanna ChurchHeadquartersYork, England, UKParentPersimmon plcWebsitecharleschurch.com Charles Church Developments Limited, trading as Charles Church, is a British upmarket housebuilding company which is headquar...

 

 

Operation MekongPosterNama lainTionghoa湄公河行動 SutradaraDante LamPemeranZhang HanyuEddie PengPerusahaanproduksiBona Film Group[1]Tanggal rilis 30 September 2016 (2016-09-30) NegaraTiongkokBahasaMandarinPendapatankotor$140 juta[2] Operation Mekong (Hanzi: 湄公河行动) adalah sebuah film aksi kejahatan Tiongkok-Hong Kong 2016 yang disutradarai oleh Dante Lam dan dibintangi oleh Zhang Hanyu dan Eddie Peng. Film tersebut berdasarkan pada pembantaian Sung...

 

 

Species of carnivore Javan ferret-badger Conservation status Least Concern  (IUCN 3.1)[1] Scientific classification Domain: Eukaryota Kingdom: Animalia Phylum: Chordata Class: Mammalia Order: Carnivora Family: Mustelidae Genus: Melogale Species: M. orientalis Binomial name Melogale orientalisBlanford, 1888 Javan ferret-badger range Synonyms Melogale personata ssp. orientalis Blanford, 1888 The Javan ferret-badger (Melogale orientalis) is a mustelid endemic to Java and Bali, ...

Ice hockey team in North Richland Hills, TexasTexas Junior BrahmasCityNorth Richland Hills, TexasLeagueNA3HLDivisionSouthFounded2010Home arenaNYTEX Sports CentreColorsBlack, purple, white     Owner(s)Dr. Salvatore Trazzera & Frank TrazzeraGeneral managerRyan Anderson[1]Head coachNicholas Cammarata[2]AffiliateLone Star Brahmas (NAHL)Franchise history2010–presentTexas Junior Brahmas The Texas Junior Brahmas are a Tier III junior ice hockey team based in...

 

 

This article is about the city in Brazil. For other uses, see Joinville (disambiguation). Municipality in South, BrazilJoinvilleMunicipalityMunicipality of JoinvilleFrom the top, clockwise: skyline of downtown Joinville, Memory Station, the National Museum of Immigration and Colonization, Rua das Palmeiras, and Holz Hotel FlagCoat of armsNickname(s): City of Princes, City of Flowers, Brazilian ManchesterMotto: Mea Autem Brasiliæ MagnitudoLocation of JoinvilleCountry BrazilRegi...

 

 

国民阵线Barisan NasionalNational Frontباريسن ناسيونلபாரிசான் நேசனல்国民阵线标志简称国阵,BN主席阿末扎希总秘书赞比里署理主席莫哈末哈山总财政希山慕丁副主席魏家祥维纳斯瓦兰佐瑟古律创始人阿都拉萨成立1973年1月1日 (1973-01-01)[1]设立1974年7月1日 (1974-07-01)前身 联盟总部 马来西亚  吉隆坡 50480 秋傑区敦依斯迈路太子世贸中心(英�...

Ardenna Ardenna gravis Klasifikasi ilmiah Domain: Eukaryota Kerajaan: Animalia Filum: Chordata Kelas: Aves Ordo: Procellariiformes Famili: Procellariidae Genus: ArdennaFowler, 1938 Spesies tipe Ardenna gravis[1]O'Reilly, 1818 Spesies[2] Ardenna pacifica Ardenna bulleri Ardenna grisea Ardenna tenuirostris Ardenna creatopus Ardenna carneipes Ardenna gravis Ardenna adalah genus burung laut dalam keluarga Procellariidae. Spesies burung penggunting laut berukuran sedang dalam genu...

 

 

The first stamp of Nicaragua issued in 1862 This is a survey of the postage stamps and postal history of Nicaragua. First stamps Nicaragua gained independence from Spain in 1821. It has produced its own stamps since 1862.[1] Collectors of the stamps and covers of Nicaragua join the Nicaragua Study Group. Search the web to find the group. References ^ Stamps of the World Volume 3. Stanley Gibbons. 2004. p. 640. Further reading Birks, Michael. The Revenues, Seals and Cinderellas o...

 

 

謝爾蓋·巴加普什Сергеи БагаҧшьСергей Багапш攝於2008年 阿布哈茲第2任總統任期2005年2月12日—2011年5月29日 前任弗拉季斯拉夫·阿尔津巴继任亞歷山大·安克瓦布  阿布哈茲第2任總理任期1997年4月29日—1999年12月20日 总统弗拉季斯拉夫·阿尔津巴前任根纳季·格古里亚继任维切斯夫·茨格巴 个人资料出生(1949-03-04)1949年3月4日 苏联喬治亞阿布哈茲苏呼米逝世2...

Genre of spy films This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Eurospy film – news · newspapers · books · scholar · JSTOR (March 2018) (Learn how and when to remove this message) James Tont operazione D.U.E. (1966) film poster spoofs the 007 hit Thunderball. Eurospy film, or Spaghetti spy film (when refe...

 

 

Cet article est une ébauche concernant la chronologie de la bande dessinée. Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants. Chronologies Données clés 1915 1916 1917  1918  1919 1920 1921Décennies :1880 1890 1900  1910  1920 1930 1940Siècles :XVIIIe XIXe  XXe  XXIe XXIIeMillénaires :-Ier Ier  IIe  IIIe Chronologies géographiques Afrique Afrique du Sud...

 

 

Glenn Morshower al Dallas International Film Festival 2011 Glenn Grove Morshower (Dallas, 24 aprile 1959) è un attore e scrittore statunitense, attivo in campo cinematografico e televisivo. Indice 1 Biografia 1.1 The Extra Mile 2 Filmografia 2.1 Cinema 2.2 Televisione 3 Doppiatori italiani 4 Altri progetti 5 Collegamenti esterni Biografia Conosciuto soprattutto per aver recitato nel ruolo dell'Agente dei Servizi Segreti Aaron Pierce, nella serie TV della Fox, 24. Il suo personaggio ha ricevu...

Questa voce sull'argomento calciatori francesi è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. Frédéric NéeNazionalità Francia Altezza183 cm Calcio RuoloAllenatore (ex attaccante) Termine carriera2007 CarrieraSquadre di club1 1996-1998 Caen56 (21)1998-2001 Bastia90 (38)2001-2003 Olympique Lione26 (3)2003-2007 Bastia92 (10) Nazionale 2001 Francia1 (0) Carriera da allenatore ...

 

 

Omar ValenciaNazionalità Panama Altezza180 cm Peso70 kg Calcio RuoloDifensore Squadra N.Y. Red Bulls CarrieraGiovanili 20??-2022 Plaza Amador Squadre di club1 2022 Plaza Amador8 (0)2022-→  N.Y. Red Bulls II33 (0)2024-→  N.Y. Red Bulls1 (0) Nazionale 2022 Panama U-205 (0)2023- Panama3 (0) 1 I due numeri indicano le presenze e le reti segnate, per le sole partite di campionato.Il simbolo → indica un trasferimento in prestito. Statistiche aggiornate al 7 ...