Уравнение Гамильтона — Якоби — Беллмана

Уравнение Гамильтона — Якоби — Беллмана — дифференциальное уравнение в частных производных, играющее центральную роль в теории оптимального управления. Решением уравнения является функция значения (англ. value function), которая даёт оптимальное значение для управляемой динамической системы с заданной функцией цены.

Если уравнения Гамильтона — Якоби — Беллмана решаются в какой-то части пространства, они играют роль необходимого условия; при решении во всём пространстве они также становятся достаточным условием для оптимального решения. Методика может быть также применена к стохастическим системам.

Классические вариационные задачи (например, задача о брахистохроне) могут быть решены с использованием этого метода.

Уравнение является результатом развития теории динамического программирования, первопроходцем которой является Ричард Беллман и его сотрудники.[1]

Соответствующее уравнение с дискретным временем называется просто уравнением Беллмана. При рассмотрении задачи с непрерывным временем полученные уравнения могут рассматриваться как продолжение более ранних работ в области теоретической физики, связанных с уравнением Гамильтона — Якоби.

Задачи оптимального управления

Рассмотрим следующую задачу оптимального управления на промежутке времени :

где С и D — функции стоимости, определяющие соответственно интегральную и терминальную часть функционала. x(t) — вектор, определяющий состояние системы в каждый момент времени. Его начальное значение x(0) считается известным. Вектор управления u(t) следует выбрать таким образом, чтобы добиться минимизации значения V.

Эволюция системы под действием управления u(t) описывается следующим образом:

Уравнение в частных производных

Для такой простой динамической системы, уравнения Гамильтона — Якоби — Беллмана принимают следующий вид:

(под подразумевается скалярное произведение) и задаются значением в конечный момент времени T:

Неизвестная в этом уравнении — беллмановская «функция значения» V(xt), которая отвечает максимальной цене, которую можно получить, ведя систему из состояния (xt) оптимальным образом до момента времени T. Соответственно, интересующая нас оптимальная стоимость — значение V = V(x(0), 0).

Вывод уравнения

Продемонстрируем интуитивные рассуждения, которые приводят к этому уравнению. Пусть  — функция значения, тогда рассмотрим переход от момента времени t к моменту t + dt в соответствии с принципом Беллмана:

Разложим последнее слагаемое по Тейлору:

Осталось перенести V(xt) влево, поделить на dt и перейти к пределу.

Примечания

  1. R. E. Bellman. Dynamic Programming. Princeton, NJ, 1957.

Литература

  • R. E. Bellman: Dynamic Programming and a new formalism in the calculus of variations. Proc. Nat. Acad. Sci. 40, 1954, 231—235.
  • R. E. Bellman: Dynamic Programming, Princeton 1957.
  • R. Bellman, S. Dreyfus: An application of dynamic programming to the determination of optimal satellite trajectories. J. Brit. Interplanet. Soc. 17, 1959, 78—83.

Read other articles:

Artikel ini perlu diwikifikasi agar memenuhi standar kualitas Wikipedia. Anda dapat memberikan bantuan berupa penambahan pranala dalam, atau dengan merapikan tata letak dari artikel ini. Untuk keterangan lebih lanjut, klik [tampil] di bagian kanan. Mengganti markah HTML dengan markah wiki bila dimungkinkan. Tambahkan pranala wiki. Bila dirasa perlu, buatlah pautan ke artikel wiki lainnya dengan cara menambahkan [[ dan ]] pada kata yang bersangkutan (lihat WP:LINK untuk keterangan lebih lanjut...

 

Irlandia SelatanSouthern IrelandDeisceart Éireann1921-1922Irlandia Selatan di bawah pemerintahan Britania Raya pada tahun 1921-1922Ibu kotaDublinPemerintahansistem pemerintahan parlementer di bawah monarki konstitusionalMonarki Ketua • Pertama Michael Collins• Terakhir W. T. Cosgrave LegislatifParlemen Irlandia Selatan(sampai dengan 27 Mei 1922) Parlemen Sementara(setelah 9 Agustus 1922; unikameral) - Majelis TinggiSenat(sampai dengan 27 Mei 1922) -...

 

Lega Pro Prima Divisione 2011-2012 Competizione Lega Pro Prima Divisione Sport Calcio Edizione 34ª Organizzatore Lega Italiana Calcio Professionistico Date dal 4 settembre 2011al 10 giugno 2012 Luogo Italia Partecipanti 36 Formula 2 gironi all'italiana A/R, play-off e play-out Risultati Vincitore Ternana (1º titolo)Spezia (2º titolo) Altre promozioni Pro VercelliVirtus Lanciano Retrocessioni MonzaFolignoSPALPiacenzaBassanoTriestina Statistiche Miglior marcatore Gir. A: Ciro G...

1993 studio album by the GodfathersThe GodfathersStudio album by the GodfathersReleased1993RecordedMay–July 1993StudioUtopia StudioHelicon MountainGooseberry Sound Studios(London)GenreRockLength44:22LabelIntercordProducerRalph JezzardThe Godfathers chronology Unreal World(1991) The Godfathers(1993) Afterlife(1995) Singles from The Godfathers Strange About TodayReleased: 1993[1] Alternative cover2013 deluxe edition The Godfathers, also known as the Orange Album, is the fifth ...

 

Pimpinan Partai Buruh Australia (ALP) ada pada tingkat federal serta di setiap negara bagian dan wilayah di Australia. Pimpinan Partai Buruh Australia dipilih dari anggota parlemen masing-masing partai lokal, baik melalui keputusan anggota atau dengan masukan dari anggota ALP yang menduduki jabatan rendah. Pimpinan tingkat federal Ketua Berikut ini adalah daftar Ketua Partai Buruh Australia (periode waktu sebagai pelaksana jabatan ketua akan dimiringkan): # Ketua Partai Mulai Selesai Durasi j...

 

I distretti pomereliani di Lauenburg e Bütow, identificati da Lb. e Bt., assoggettati ai duchi della Pomerania (nel 1526) La Terra di Lauenburg e Bütow[1][2][3] (in tedesco Länder o Lande Lauenburg und Bütow, in polacco Ziemia lęborsko-bytowska) costituì una regione storica della Pomerania orientale. Composta da due distretti incentrati intorno alle città di Lauenburg (oggi Lębork) e Bütow (Bytów), costituiva la periferia occidentale della Pomerelia...

Cacia cretifera Klasifikasi ilmiah Kerajaan: Animalia Filum: Arthropoda Kelas: Insecta Ordo: Coleoptera Famili: Cerambycidae Subfamili: Lamiinae Tribus: Mesosini Genus: Cacia Spesies: Cacia cretifera Cacia cretifera adalah spesies kumbang tanduk panjang yang tergolong famili Cerambycidae. Spesies ini juga merupakan bagian dari genus Cacia, ordo Coleoptera, kelas Insecta, filum Arthropoda, dan kingdom Animalia. Larva kumbang ini biasanya mengebor ke dalam kayu dan dapat menyebabkan kerusakan ...

 

Zurigo-ZugoStati attraversati Svizzera InizioZurigo FineZugo Attivazione1864 GestoreFFS Precedenti gestoriZZL (1864-1891)NOB (1892-1902) Lunghezza34,79 km Scartamento1 435 mm Elettrificazione15000 V CA 16,7 Hz Ferrovie Modifica dati su Wikidata · Manuale La ferrovia Zurigo-Zugo è una linea ferroviaria a scartamento normale della Svizzera .Il percorso conduce attraverso lo storico Knonaueramt (ora quartiere di Affoltern), che gli è valso anche il nome colloquiale It...

 

Державний комітет телебачення і радіомовлення України (Держкомтелерадіо) Приміщення комітетуЗагальна інформаціяКраїна  УкраїнаДата створення 2003Керівне відомство Кабінет Міністрів УкраїниРічний бюджет 1 964 898 500 ₴[1]Голова Олег НаливайкоПідвідомчі ор...

非常尊敬的讓·克雷蒂安Jean ChrétienPC OM CC KC  加拿大第20任總理任期1993年11月4日—2003年12月12日君主伊利沙伯二世总督Ray HnatyshynRoméo LeBlancAdrienne Clarkson副职Sheila Copps赫布·格雷John Manley前任金·坎貝爾继任保羅·馬田加拿大自由黨黨魁任期1990年6月23日—2003年11月14日前任約翰·特納继任保羅·馬田 高級政治職位 加拿大官方反對黨領袖任期1990年12月21日—1993年11月...

 

 烏克蘭總理Прем'єр-міністр України烏克蘭國徽現任杰尼斯·什米加尔自2020年3月4日任命者烏克蘭總統任期總統任命首任維托爾德·福金设立1991年11月后继职位無网站www.kmu.gov.ua/control/en/(英文) 乌克兰 乌克兰政府与政治系列条目 宪法 政府 总统 弗拉基米尔·泽连斯基 總統辦公室 国家安全与国防事务委员会 总统代表(英语:Representatives of the President of Ukraine) 总...

 

此条目序言章节没有充分总结全文内容要点。 (2019年3月21日)请考虑扩充序言,清晰概述条目所有重點。请在条目的讨论页讨论此问题。 哈萨克斯坦總統哈薩克總統旗現任Қасым-Жомарт Кемелұлы Тоқаев卡瑟姆若马尔特·托卡耶夫自2019年3月20日在任任期7年首任努尔苏丹·纳扎尔巴耶夫设立1990年4月24日(哈薩克蘇維埃社會主義共和國總統) 哈萨克斯坦 哈萨克斯坦政府...

Association football club in England Football clubHebburn TownFull nameHebburn Town Football ClubNickname(s)The HornetsFounded1912GroundHebburn Sports & Social Ground, HebburnChairmanVin PearsonManagerDaniel MooreLeagueNorthern Premier League Premier Division2023–24Northern Premier League Division One East, 1st of 20 (promoted) Home colours Hebburn Town Football Club is a football club based in Hebburn, Tyne and Wear, England. The club are currently members of the Northern Premier Leagu...

 

Beethoven en 1804. El concierto para violín en re mayor, Op. 61 fue compuesto por Ludwig van Beethoven en 1806. La partitura está dedicada a Stephan von Breuning y fue escrita para ser interpretada por el violinista Franz Clement.[1]​[2]​[3]​ Historia Composición Primera página de la partitura autógrafa en la Biblioteca Nacional de Austria, Viena. La composición de este concierto se desarrolló desde noviembre-diciembre de 1806 hasta la revisión hecha entre finales de...

 

Town in County Mayo, Ireland Not to be confused with Ballina, County Tipperary. Town in Connacht, IrelandBallina Béal an ÁthaTownRiver Moy, Ballina Coat of armsBallinaLocation in IrelandCoordinates: 54°07′00″N 9°10′00″W / 54.1167°N 9.1667°W / 54.1167; -9.1667CountryIrelandProvinceConnachtCountyCounty MayoElevation7 m (23 ft)Population (2022)[1]10,556Time zoneUTC±0 (WET) • Summer (DST)UTC+1 (IST)Eircode routing keyF26Tel...

British Labour Party politician This article's subject is standing for re-election to the British House of Commons on 4 July, and has not been an MP since the dissolution of Parliament on 30 May. This article may be out of date during this period. Feel free to improve it (updates without reliable references will be removed) or discuss changes on the talk page. MajorDan JarvisMBE MPOfficial portrait, 2020Member of Parliamentfor Barnsley CentralIncumbentAssumed office 3 March 2011...

 

Part of a series aboutImperialism studies Theories Dependency theory Intercommunalism Neo-Gramscianism Neocolonialism Social imperialism Super-imperialism Three Worlds Theory Ultra-imperialism World-systems theory Concepts Ecologically unequal exchange North–South model Unequal exchange Superprofit Uneven and combined development People Samir Amin Giovanni Arrighi Paul A. Baran Charles Bettelheim Ľuboš Blaha Nikolai Bukharin Arghiri Emmanuel John Bellamy Foster Andre Gunder Frank Michael ...

 

Продналог — твёрдофиксированный продовольственный натуральный налог, взимавшийся с крестьянских хозяйств, введённый декретом ВЦИК от 21 марта 1921 года взамен продразвёрстки. Был первым актом Новой экономической политики. Вопрос о замене продразвёрстки продналогом б...

Musical traditions of the Muslim world This article includes a list of general references, but it lacks sufficient corresponding inline citations. Please help to improve this article by introducing more precise citations. (November 2015) (Learn how and when to remove this message) A Musical Gathering – Ottoman, 18th century Part of a series onIslamic studies HistoryPhilosophyTheology Early historiography Early social changes Early / Modern philosophy EschatologyConcept of God Tawhi...

 

Artemision di SiracusaTempio JonicoColonne dell'Artemision siracusanoUtilizzoTempio sacro Stileionico EpocaVI secolo a.C. LocalizzazioneStato Italia ComuneSiracusa DimensioniAltezza25 metri Larghezza59 metri ScaviDate scavi1910-13 1960-63 OrganizzazioneSovrintendenza alle Antichità ArcheologoPaolo Orsi, Luigi Bernabò Brea AmministrazionePatrimonioSiracusa e la Necropoli Rupestre di Pantalica EnteComune di Siracusa Sito webwww.regione.sicilia.it - beniculturali Mappa di localizzazione M...