Гауссовский процесс

В теории вероятностей и статистике гауссовский процесс — это стохастический процесс (или случайный процесс — это такое семейство случайных величин, статистические свойства элементов которого зависят от скалярного параметра t, которому придаётся смысл времени), такой что любой конечный набор этих случайных величин имеет многомерное нормальное распределение (гауссовское распределение), то есть любая конечная линейная комбинация из них нормально распределена. Распределение гауссовского процесса – это совместное распределение всех его случайных величин и, в силу чего, является распределением функций с непрерывной областью определения.

Если рассматривать гауссовский процесс как способ решения задач машинного обучения, то используется ленивое обучение и мера подобия между точками (функция ядра) для получения прогноза значения невидимой точки из обучающей выборки. В понятие прогноза, помимо самой оценки точки, входит информация о неопределенности — одномерное гауссовское распределение.[1]

Для вычисления прогнозов некоторых функций ядра используют метод матричной алгебры, кригинг.

Гауссовский процесс назван так в честь Карла Фридриха Гаусса, поскольку в его основе лежит понятие гауссовского распределения (нормального распределения). Гауссовский процесс может рассматриваться как бесконечномерное обобщение многомерных нормальных распределений. Эти процессы применяются в статистическом моделировании; в частности используются свойства нормальности. Например, если случайный процесс моделируется как гауссовский, то распределения различных производных величин, такие как среднее значение процесса в течение определенного промежутка времени и погрешность его оценки с использованием выборки значений, могут быть получены явно.

Определение

Случайный процесс с непрерывным временем является гауссовским тогда и только тогда, когда для любого конечного множества индексов из множества индексов

- многомерная гауссовская случайная величина.[2] То же самое, что и всякая линейная комбинация имеет одномерное нормальное (гауссовское) распределение. Используя характеристические функции случайных величин, свойство Гаусса можно сформулировать следующим образом: - гауссовское тогда и только тогда, когда для любого конечного множества индексов , существуют вещественные значения , где такие, что для всех выполнено равенство

Где - мнимая единица.

Числа и - ковариации и средние значения переменных в процессах соответственно[3].

Ковариационные функции

Главная особенность гауссовских процессов - они могут быть полностью определены второй порядковой статистикой[4]. Следовательно, ковариационная функция полностью определяет поведение процесса, если математическое ожидание гауссовского процесса равно нулю. Неотрицательная определенность функции делает возможным её спектральное разложение при помощи разложения Карунена — Лоэва. Через ковариационную функцию можно определить стационарность, изотропию, гладкость и периодичность процесса[4][5].

Стационарность выражает поведение процесса относительно расстояния между любыми двумя точками и . Если процесс стационарный, то он зависит от взаимного расположения своих точек, расстояния между ними, , в ином случае, он нестационарный, то есть зависит от фактического положения точек и . Примером может послужить частный случай процесса Орнштейна — Уленбека, процесс броуновского движения: он является стационарным.

Если процесс зависит только от , евклидова расстояния (не направления) между и , то процесс считается изотропным. Стационарный и изотропный процесс называют однородным;[6] на практике свойства стационарности и изотропии отражают различия(или, скорее, их отсутствие) в поведении процесса с учётом положения наблюдателя.

Суть гауссовских процессов заключается в получении априорных распределений вероятности, гладкость которых зависит от взятой ковариационной функции[4]. Если мы ожидаем, что для "лежащих близко" входных точек и соответствующие им выходные точки и также "лежат близко", тогда присутствует предположение о непрерывности функции. Если мы хотим допустить значительное смещение, то нужно выбрать более грубую ковариационную функцию. В качестве примеров крайнего поведения можно привести ковариационную функцию Орнштейна — Уленбека и квадратичную экспоненциальную функцию, где первая не дифференцируема нигде, а последняя бесконечно дифференцируема.

Под периодичностью понимается индуцирование периодических закономерностей в поведении процесса. Формально это достигается путём отображения входного значения на двумерный вектор

Обычные ковариационные функции

Влияние выбора различных ядер на функцию распределения гауссовского процесса. Слева направо: квадратичное экспоненциальное ядро, броуновское, квадратичное.

Существует ряд общих ковариационных функций:[5]

  • Константа:
  • Линейная функция:
  • Гауссовский шум:
  • Квадратичная экспоненциальная функция:
  • Функция Орнштейна — Уленбека:
  • Matérn:
  • Периодическая функция:
  • Рациональная квадратичная функция:

Здесь . Параметр является характеристикой масштаба длины процесса (практически, «насколько близко» две точки и должны быть, чтобы значительно влиять друг на друга), - это символ Кронекера и - среднеквадратическое отклонение колебаний шума. Кроме того, является модифицированной функцией Бесселя и - это гамма-функция, вычисленная по . Сложную ковариационную функцию можно определить как линейную комбинацию других более простых ковариационных функций затем, чтобы объединить различную информацию об имеющихся наборах данных.

Полученные результаты зависят от значений гиперпараметров (например, и ), определяющих поведение модели.

Броуновское движение как интеграл гауссовских процессов

Винеровский процесс (так называемое броуновское движение) является интегралом гауссовского процесса белого шума. Он не стационарен, однако имеет стационарные приращения.

Процесс Орнштейна — Уленбека — это стационарный гауссовский процесс.

Броуновский мост (подобный процессу Орнштейна — Уленбека) является примером гауссовского процесса, приращения которого не являются независимыми.

Дробное броуновское движение является гауссовским процессом, ковариационная функция которого является обобщением функции винеровского процесса.

Приложения

Пример регрессии на основе гауссовского процесса по сравнению с другими регрессионными моделями.[7]

Гауссовский процесс может быть использован как априорное распределение вероятностей функций в байесовском выводе.[5][8] Для любого множества из N точек в нужной области функций возьмите многомерное гауссовское распределение, ковариационный матричный параметр которого является определителем Грама взятых N точек с некоторым желаемым ядром, и выборку из этого распределения.

Вывод непрерывных значений на основе гауссовского процесса, определяемого предыдущими ковариациями, известен как кригинг (регрессия на основе гауссовского процесса). Поэтому, гауссовские процессы полезны в качестве мощного нелинейного многомерного инструмента интерполяции. Регрессия на основе гауссовского процесса может быть дополнительно расширена для решения задач обучения как с учителем, так и без (самообучение).

Прогноз гауссовского процесса или кригинг

Регрессия на основе гауссовского процесса (прогнозирование) с квадратичным экспоненциальным ядром.

Когда речь идёт об основной проблеме регрессии на основе гауссовского процесса (кригинге), предполагается, что для гауссовского процесса , наблюдаемого в координатах , вектор значений является всего лишь одной из выборок многомерного гауссовского распределения, размерность которого равна числу наблюдаемых координат . Следовательно, согласно допущению о нулевом распределении, , где - ковариационная матрица между всеми возможными парами для заданного множества гиперпараметров .[5] Таким образом, логарифм предельной вероятности равен:

и максимизация этой предельной вероятности по отношению к даёт полную характеристику гауссовского процесса . Первое выражение зависит от неспособности модели соответствовать наблюдаемым значениям, а второе выражение прямо пропорционально сложности модели. Указав и сделав прогноз о ненаблюдаемых значениях в координатах , останется сделать график выборок из прогностического распределения , где последующая средняя оценка определяется как

и последующая оценка дисперсии B определяется как

где - ковариация между новой оценкой координаты и всеми другими наблюдаемыми координатами для данного гиперпараметрического вектора , и определены как и прежде, а является дисперсией в точке , продиктованной вектором . Последующая средняя оценка ("точечная оценка") является линейной комбинацией наблюдений ; аналогичным образом дисперсия фактически не зависит от наблюдений . Известным узким местом в прогнозировании гауссовского процесса является то, что вычислительная сложность прогнозирования является кубической по числу точек , то есть вычисление может быть невозможным для больших наборов данных.[4] Чтобы обойти эту проблему, ведутся работы по разреженным гауссовским процессам, которые обычно основаны на идее построения репрезентативного набора для данного процесса .[9][10]

См. также

Примечания

  1. Platypus Innovation: A Simple Intro to Gaussian Processes (a great data modelling tool). Дата обращения: 15 января 2018. Архивировано 1 мая 2018 года.
  2. MacKay, David, J.C.[англ.]. Information Theory, Inference, and Learning Algorithms (англ.). — Cambridge University Press, 2003. — P. 540. — ISBN 9780521642989. Архивировано 19 октября 2016 года.. — «"The probability distribution of a function is a Gaussian processes if for any finite selection of points , the density is a Gaussian"».
  3. Dudley, R.M. Real Analysis and Probability. — Wadsworth and Brooks/Cole, 1989.
  4. 1 2 3 4 Barber, David. Bayesian Reasoning and Machine Learning. — Cambridge University Press, 2012. — ISBN 978-0-521-51814-7. Архивировано 11 ноября 2020 года.
  5. 1 2 3 4 Rasmussen, C.E.; Williams, C.K.I. Gaussian Processes for Machine Learning. — MIT Press, 2006. — ISBN 0-262-18253-X. Архивировано 22 мая 2021 года.
  6. Grimmett, Geoffrey; David Stirzaker. Probability and Random Processes (англ.). — Oxford University Press, 2001. — ISBN 0198572220.
  7. The documentation for scikit-learn also has similar examples Архивная копия от 19 апреля 2021 на Wayback Machine.
  8. Архивированная копия (англ.). Дата обращения: 15 января 2018. Архивировано из оригинала 4 марта 2016 года.Архивированная копия. Дата обращения: 15 января 2018. Архивировано из оригинала 4 марта 2016 года.
  9. Smola, A.J.; Schoellkopf, B. Sparse greedy matrix approximation for machine learning (англ.) // Proceedings of the Seventeenth International Conference on Machine Learning : journal. — 2000. — P. 911—918.
  10. Csato, L.; Opper, M. Sparse on-line Gaussian processes (англ.) // Neural Computation[англ.]. — 2002. — Vol. 14. — P. 641—668. — doi:10.1162/089976602317250933.

Внешние ссылки

Программное обеспечение

Read other articles:

Artikel ini memiliki beberapa masalah. Tolong bantu memperbaikinya atau diskusikan masalah-masalah ini di halaman pembicaraannya. (Pelajari bagaimana dan kapan saat yang tepat untuk menghapus templat pesan ini) Biografi ini memerlukan lebih banyak catatan kaki untuk pemastian. Bantulah untuk menambahkan referensi atau sumber tepercaya. Materi kontroversial atau trivial yang sumbernya tidak memadai atau tidak bisa dipercaya harus segera dihapus, khususnya jika berpotensi memfitnah.Cari sumber:...

 

2008 United States Senate election in Louisiana ← 2002 November 4, 2008 2014 →   Nominee Mary Landrieu John Kennedy Party Democratic Republican Popular vote 988,298 867,177 Percentage 52.11% 45.72% Parish resultsCongressional district resultsPrecinct resultsLandrieu:      40-50%      50–60%      60–70%      70–80%      80–90% ...

 

Jeff Sessions [[Jaksa Agung Amerika Serikat]] 84Masa jabatan9 Februari 2017 – 14 Februari 2019PresidenDonald TrumpWakilDana Boente (Penjabat)Rod Rosenstein PendahuluLoretta LynchPenggantiWilliam BarrSenator Amerika Serikat dari AlabamaMasa jabatan3 Januari 1997 – 8 Februari 2017 PendahuluHowell HeflinPenggantiLuther Strange[[Jaksa Agung Alabama]] 44Masa jabatan16 Januari 1995 – 3 Januari 1997GubernurFob James PendahuluJimmy EvansPenggantiBill PryorJaks...

2014 novel by Anthony Doerr For the television adaptation, see All the Light We Cannot See (miniseries). All the Light We Cannot See First edition coverAuthorAnthony DoerrCountryUnited StatesLanguageEnglishGenreHistorical fictionPublishedMay 6, 2014PublisherScribnerMedia typePrint (hardback and softback)Pages544 (hardback); 531 (softback)AwardsPulitzer Prize for Fiction, Andrew Carnegie Medal for Excellence in FictionISBN978-1-4767-4658-6OCLC852226410LC ClassPS3604.O34 A77 2014 All ...

 

2018 Massachusetts general election ← 2016 November 6, 2018 2020 → Part of the2018 United States elections Elections in Massachusetts General 1942 1944 1946 1948 1950 1952 1954 1956 1958 1960 1962 1964 1966 1970 1974 1978 1982 1986 1990 1994 1998 2002 2006 2008 2010 2012 2014 2016 2018 2020 2022 Federal government U.S. President 1788–89 1792 1796 1800 1804 1808 1812 1816 1820 1824 1828 1832 1836 1840 1844 1848 1852 1856 1860 1864 1868 1872 1876 1880 1884 1888 1892 189...

 

Redrose RecordsDidirikanOktober 2020Pendiri Isyana Sarasvati DistributorDistribusi sendiriGenreBervariasi, pop neo classic progressive rock folk Asal negaraIndonesiaLokasiJakarta, IndonesiaSitus webredrose-records.com Redrose Records (nama digayakan dengan huruf kapital semua) merupakan label rekaman yang didirikan oleh Isyana Sarasvati bersama manajemennya pada tahun 2020.[1][2] Alasan Isyana memberikan nama Redrose adalah dengan harapan, apa yang dirintisnya dapat mekar dan ...

Eccidi dell'alto Renostrage Data inizio4 luglio 1944 Data fine2 ottobre 1944 LuogoValli dell'alto Reno italiano(Emilia-Romagna) Stato Repubblica Sociale Italiana Coordinate44°10′53.07″N 10°58′49.13″E / 44.181408°N 10.980313°E44.181408; 10.980313Coordinate: 44°10′53.07″N 10°58′49.13″E / 44.181408°N 10.980313°E44.181408; 10.980313 ComandanteWalter Reder ObiettiviPopolazionePartigiani Responsabili16. SS-Panzergrenadier-Division Reichsf...

 

2014 film The Look of SilenceTheatrical release posterDirected byJoshua OppenheimerProduced bySigne Byrge SørensenCinematographyLars SkreeEdited byNiels Pagh AndersenMusic by Seri Banang Mana Tahan Productioncompanies Anonymous Final Cut for Real Making Movies Oy Piraya Film A/S Spring Films Distributed by Why Not Productions (France) Koch Media (Germany) Cinema Delicatessen (Netherlands) Drafthouse Films (US) Release date 28 August 2014 (2014-08-28) (Venice) Running time1...

 

Charente limousine Paysage à La Péruse. Pays France Région française Nouvelle-Aquitaine Département français Charente Villes principales ConfolensChabanaisChasseneuil-sur-Bonnieure Géologie granite, schiste Relief 100-370m Production bovins Communes 42 Population totale 28 749 hab. (1999) Régions naturellesvoisines Monts de la Marchemonts de BlondPays de la Viennepays de Rochechouartpays des Feuillardiers)NontronnaisKarst de La RochefoucauldRuffécoisMontmorillonnaisCivraisien P...

2020年夏季奥林匹克运动会波兰代表團波兰国旗IOC編碼POLNOC波蘭奧林匹克委員會網站olimpijski.pl(英文)(波兰文)2020年夏季奥林匹克运动会(東京)2021年7月23日至8月8日(受2019冠状病毒病疫情影响推迟,但仍保留原定名称)運動員206參賽項目24个大项旗手开幕式:帕维尔·科热尼奥夫斯基(游泳)和马娅·沃什乔夫斯卡(自行车)[1]闭幕式:卡罗利娜·纳亚(皮划艇)&#...

 

Campionati mondiali femminili di pallacanestro Under-21Sport Pallacanestro FederazioneFIBA OrganizzatoreFederazione Internazionale Pallacanestro TitoloCampione del Mondo Under-21 Cadenzaquadriennale Sito Internetfiba.com StoriaFondazione2003 Soppressione2007 Detentore Stati Uniti Modifica dati su Wikidata · Manuale I Campionati mondiali femminili di pallacanestro Under-21 erano una competizione cestistica internazionale a cadenza quadriennale organizzata dalla FIBA, la Federazione Inter...

 

Destruction in the Middle East Cemetery in Qayyarah, Nineveh Governorate, Iraq destroyed by the Islamic State (November 2016) Part of a series on the  History of theIslamic State Jama'at al-Tawhid wal-Jihad (1999–2004) Al-Qaeda in Iraq (2004–2006) Jama'at Jaysh Ahl al-Sunnah wa-l-Jama'ah (2004–2006) Jaish al-Ta'ifa al-Mansurah (2004–2006) Mujahideen Shura Council (2006) Islamic State of Iraq (2006–2013) Islamic State of Iraq and the Levant (20...

العلاقات البريطانية البوتانية المملكة المتحدة بوتان   المملكة المتحدة   بوتان تعديل مصدري - تعديل   العلاقات البريطانية البوتانية هي العلاقات الثنائية التي تجمع بين المملكة المتحدة وبوتان.[1][2][3][4][5] مقارنة بين البلدين هذه مقارنة عامة ومر�...

 

Greek Volunteer GuardГрчка Добровољачка Гарда Ελληνική Εθελοντική ΦρουράInsignia of the Greek Volunteer Guard.Active1993–1995Allegiance Republika SrpskaBranch Army of Republika SrpskaTypeInfantrySize~100Garrison/HQVlasenicaEngagementsYugoslav Wars Bosnian War Siege of Srebrenica Military unit The Greek Volunteer Guard (Serbian: Грчка Добровољачка Гарда Grčka Dobrovoljačka Garda; Greek: Ελληνική Εθελοντικ...

 

River in Idaho, United StatesBlackfoot RiverBlackfoot RiverLocation of the mouth of the Blackfoot River in IdahoShow map of IdahoBlackfoot River (Idaho) (the United States)Show map of the United StatesLocationCountryUnited StatesStateIdahoCountiesCaribou County, Idaho, Bingham County, IdahoPhysical characteristicsSource  • locationnortheast of Soda Springs, Caribou County, Idaho • coordinates42°50′22″N 111°18′32″W / 42.83944�...

This article relies largely or entirely on a single source. Relevant discussion may be found on the talk page. Please help improve this article by introducing citations to additional sources.Find sources: Leinster Senior League rugby union – news · newspapers · books · scholar · JSTOR (March 2015) The Leinster Senior League, inaugurated in 1971–72,[1] is a rugby union competition for senior clubs in the Irish province of Leinster. It has...

 

American actor (1904–1989) This article includes a list of general references, but it lacks sufficient corresponding inline citations. Please help to improve this article by introducing more precise citations. (September 2017) (Learn how and when to remove this message) William ChalleeWilliam Challee in The Texan (1958)BornWilliam John Challe(1904-04-06)April 6, 1904Chicago, Illinois, USADiedMarch 11, 1989(1989-03-11) (aged 84)Woodland Hills, Los Angeles, California, USAOccupationActor...

 

Suisse aux Jeux olympiques d'hiver de 1948 Code CIO SUI Comité Comité olympique Suisse Lieu Saint-Moritz Participation 5e aux Jeux d'hiver Athlètes 70 (59 hommes et 11 femmes) dans 9 sports Porte-drapeau Felix Endrich(bobsleigh, ouverture)Karl Molitor(ski alpin, clôture) MédaillesRang : 3e Or3 Arg.4 Bron.3 Total10 Historique Jeux olympiques d'été 1896 1900 1904 1908 1912 1920 1924 1928 1932 1936 1948 1952 1956 1960 1964 1968 1972 1976 1980 1984 1988 1992 1996 2000 2004 2008 2012 ...

Cet article est une ébauche concernant une localité anglaise. Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants. Cuffley Administration Pays Royaume-Uni Nation Angleterre Comté Hertfordshire District Welwyn Hatfield Force de police Police d'Hertfordshire Indicatif 01707 Démographie Population 4 295 hab. (2001) Géographie Coordonnées 51° 42′ 39″ nord, 0° 06′ 48″...

 

Este artículo o sección necesita referencias que aparezcan en una publicación acreditada. Busca fuentes: «Clínica» – noticias · libros · académico · imágenesEste aviso fue puesto el 22 de junio de 2014. Para otros usos de este término, véase Clínica (desambiguación). Punto de acceso de atención médica, que brinda atención primaria de salud a los residentes del pueblo de Veliki Vrag, en el óblast de Nizni Nóvgorod, en Rusia. Entrada a una clínica quir...