Ограниченная машина Больцмана

Ограниченная машина Больцмана

Ограниченная машина Больцмана (англ. restricted Boltzmann machine), сокращённо RBM — вид генеративной стохастической нейронной сети, которая определяет распределение вероятности на входных образцах данных.

Первая ограниченная машина Больцмана была построена в 1986 году Полом Смоленски под названием Harmonium[1], но приобрела популярность только после изобретения Хинтоном быстрых алгоритмов обучения в середине 2000-х годов.

Такое название машина приобрела как модификация обычной машины Больцмана, в которой нейроны разделили на видимые и скрытые, а связи допустимы только между нейронами разного типа, таким способом ограничив связи. Значительно позже, в 2000-х годах, ограниченные машины Больцмана приобрели большую популярность и стали рассматриваться уже не как вариации машины Больцмана, а как особые компоненты в архитектуре сетей глубинного обучения. Объединение нескольких каскадов ограниченных машин Больцмана формирует глубокую сеть доверия, особый вид многослойных нейронных сетей, которые могут самообучаться без учителя при помощи алгоритма обратного распространения ошибки[2].

Особенностью ограниченных машин Больцмана является возможность проходить обучение без учителя, но в определённых приложениях ограниченные машины Больцмана обучаются с учителем. Скрытый слой машины представляет собой глубокие признаки в данных, которые выявляются в процессе обучения (см. также Data mining).

Ограниченные машины Больцмана имеют широкий спектр применений — это задачи снижения размерности данных[3], задачи классификации[4], коллаборативная фильтрация[5], выделение признаков (англ. feature learning)[6] и тематическое моделирование[7].

В ограниченной машине Больцмана нейроны образуют двудольный граф, с одной стороны графа находятся видимые нейроны (вход), а с другой стороны — скрытые, причём перекрёстные связи устанавливаются между каждым видимым и каждым скрытым нейроном. Такая система связей позволяет применить при обучении сети метод градиентного спуска с контрастивной дивергенцией[8].

Структура сети

Ограниченная машина Больцмана базируется на бинарных элементах с распределением Бернулли, составляющие видимый и скрытый слои сети. Связи между слоями задаются с помощью матрицы весов (размера m × n), а также смещений для видимого слоя и для скрытого слоя.

Вводится понятие энергии сети (v, h) как

или в матричной форме

Подобной функцией энергии обладает также Сеть Хопфилда. Как и для обычной машины Больцмана, через энергию определяется вероятность распределения на векторах видимого и скрытого слоя[9]:

где  — статсумма, определяемая как для всех возможных сетей (иными словами,  — константа нормализации, которая гарантирует, что сумма всех вероятностей равна единице). Определение вероятности для отдельного входного вектора (маргинальное распределение) проводится аналогично через сумму конфигураций всевозможных скрытых слоёв[9]:

По причине структуры сети как двудольного графа, отдельные элементы скрытого слоя независимы друг от друга и активируют видимый слой, и наоборот отдельные элементы видимого слоя независимы друг от друга и активируют скрытый слой[8]. Для видимых элементов и для скрытых элементов условные вероятности v определяются через произведения вероятностей h:

и наоборот условные вероятности h определяются через произведение вероятностей v:

Конкретные вероятности активации для одного элемента определяются как

и

где  — логистическая функция для активации слоя.

Видимые слои могут иметь также мультиномиальное распределение, в то время как скрытые слои распределены по Бернулли. В случае мультиномиальности вместо логистической функции используется softmax:

где K — количество дискретных значений видимых элементов. Такое представление используется в задачах тематического моделирования[7] и в рекомендательных системах[5].

Связь с другими моделями

Ограниченная машина Больцмана представляет собой частный случай обычной машины Больцмана и марковской сети[10][11]. Их графовая модель соответствует графовой модели факторного анализа[12].

Алгоритм обучения

Целью обучения является максимизация вероятности системы с заданным набором образцов (матрицы, в которой каждая строка соответствует одному образцу видимого вектора ), определяемой как произведение вероятностей

или же, что одно и то же, максимизации логарифма произведения:[10][11]

Для тренировки нейронной сети используется алгоритм контрастивной дивергенции (CD) с целью нахождения оптимальных весов матрицы , его предложил Джеффри Хинтон, первоначально для обучения моделей PoE («произведение экспертных оценок»)[13][14]. Алгоритм использует семплирование по Гиббсу для организации процедуры градиентного спуска, аналогично методу обратного распространения ошибок для нейронных сетей.

В целом один шаг контрастивной дивергенции (CD-1) выглядит следующим образом:

  1. Для одного образца данных v вычисляются вероятности скрытых элементов и применяется активация для скрытого слоя h для данного распределения вероятностей.
  2. Вычисляется внешнее произведение (семплирование) для v и h, которое называют позитивным градиентом.
  3. Через образец h проводится реконструкция образца видимого слоя v', а потом выполняется снова семплирование с активацией скрытого слоя h'. (Этот шаг называется Семплирование по Гиббсу.)
  4. Далее вычисляется внешнее произведение, но уже векторов v' и h', которое называют негативным градиентом.
  5. Матрица весов поправляется на разность позитивного и негативного градиента, помноженного на множитель, задающий скорость обучения: .
  6. Вносятся поправки в биасы a и b похожим способом: , .

Практические указания по реализации процесса обучения можно найти на личной странице Джеффри Хинтона[9].

См. также

Ссылки

  1. Архивированная копия (англ.). Дата обращения: 10 ноября 2017. Архивировано из оригинала 13 июня 2013 года.Архивированная копия. Дата обращения: 10 ноября 2017. Архивировано из оригинала 13 июня 2013 года.
  2. Hinton, G. Deep belief networks (неопр.) // Scholarpedia. — 2009. — Т. 4, № 5. — С. 5947. — doi:10.4249/scholarpedia.5947. Архивировано 4 декабря 2015 года.
  3. Hinton, G. E.; Salakhutdinov, R. R. Reducing the Dimensionality of Data with Neural Networks (англ.) // Science : journal. — 2006. — Vol. 313, no. 5786. — P. 504—507. — doi:10.1126/science.1127647. — PMID 16873662. Архивировано 23 декабря 2015 года.
  4. Larochelle, H.; Bengio, Y. (2008). Classification using discriminative restricted Boltzmann machines (PDF). Proceedings of the 25th international conference on Machine learning - ICML '08. p. 536. doi:10.1145/1390156.1390224. ISBN 9781605582054. Архивировано из оригинала (PDF) 13 октября 2017. Дата обращения: 10 ноября 2017.
  5. 1 2 Salakhutdinov, R.; Mnih, A.; Hinton, G. (2007). Restricted Boltzmann machines for collaborative filtering. Proceedings of the 24th international conference on Machine learning - ICML '07. p. 791. doi:10.1145/1273496.1273596. ISBN 9781595937933.
  6. Coates, Adam; Lee, Honglak; Ng, Andrew Y. (2011). An analysis of single-layer networks in unsupervised feature learning (PDF). International Conference on Artificial Intelligence and Statistics (AISTATS). Архивировано из оригинала (PDF) 20 декабря 2014. Дата обращения: 10 ноября 2017.
  7. 1 2 Ruslan Salakhutdinov and Geoffrey Hinton (2010). Replicated softmax: an undirected topic model Архивная копия от 25 мая 2012 на Wayback Machine. Neural Information Processing Systems 23
  8. 1 2 Miguel Á. Carreira-Perpiñán and Geoffrey Hinton (2005). On contrastive divergence learning. Artificial Intelligence and Statistics.
  9. 1 2 3 Geoffrey Hinton (2010). A Practical Guide to Training Restricted Boltzmann Machines Архивная копия от 25 сентября 2014 на Wayback Machine. UTML TR 2010—003, University of Toronto.
  10. 1 2 Sutskever, Ilya; Tieleman, Tijmen. On the convergence properties of contrastysive divergence (англ.) // Proc. 13th Int'l Conf. on AI and Statistics (AISTATS) : journal. — 2010. Архивировано 10 июня 2015 года.
  11. 1 2 Asja Fischer and Christian Igel. Training Restricted Boltzmann Machines: An Introduction. Архивная копия от 10 июня 2015 на Wayback Machine. Pattern Recognition 47, p. 25—39, 2014.
  12. María Angélica Cueto; Jason Morton; Bernd Sturmfels. Geometry of the restricted Boltzmann machine (неопр.) // Algebraic Methods in Statistics and Probability. — American Mathematical Society, 2010. — Т. 516. — arXiv:0908.4425. (недоступная ссылка)
  13. Geoffrey Hinton (1999). Products of Experts Архивная копия от 24 сентября 2015 на Wayback Machine. ICANN 1999.
  14. Hinton, G. E. Training Products of Experts by Minimizing Contrastive Divergence (англ.) // Neural Computation[англ.] : journal. — 2002. — Vol. 14, no. 8. — P. 1771—1800. — doi:10.1162/089976602760128018. — PMID 12180402. Архивировано 3 марта 2016 года.

Литература

Read other articles:

Overview of disc golf practiced in Finland Disc golf in FinlandHole #18 at Hauninen DiscGolfPark in RaisioGoverning bodyFDGAFirst played1980s[1]Registered players2,815National competitions European Open Disc golf (in Finnish: frisbeegolf) is a popular sport in Finland played at the recreational, club, and international competition levels.[2][3] Disc golf in Finland is governed by the Finnish Disc Golf Association (FDGA, Finnish: Suomen frisbeegolfliitto). Its mission i...

 

Gapura WringinlawangBangunan gerbang dari bata.Galat Lua: .Informasi umumGaya arsitekturcandi bentarKotadekat Mojokerto, Jawa TimurNegara IndonesiaRampungabad ke-14KlienMajapahitData teknisUkuran13 m x 11 m Gapura Wringinlawang adalah sebuah gapura peninggalan kerajaan Majapahit abad ke-14 yang berada di Jatipasar, Kecamatan Trowulan, Kabupaten Mojokerto, Jawa Timur, Indonesia. Bangunan ini terletak tak jauh ke selatan dari jalan utama di Jatipasar. Dalam bahasa Jawa, Wringinlawang berar...

 

American actor Danny PudiPudi in July 2013BornDaniel Mark Pudi (1979-03-10) March 10, 1979 (age 45)[1]Chicago, Illinois, U.S.EducationMarquette UniversityOccupationActorYears active2005–presentSpouse Bridget Showalter ​(m. 2004)​Children2 Daniel Mark Pudi (born March 10, 1979)[1] is an American actor and director. His roles include Abed Nadir on the NBC sitcom Community (2009–2015),[2] for which he received three nominations f...

Beauty pageant Nuestra Belleza Paraguay 2014DateSeptember 13, 2014[1]PresentersKike Casanova Tania DomaniczkyCarmiña MasiVenueYacht & Golf Club Paraguayo, Asunción, ParaguayBroadcasterLaTeleEntrants15Placements8WinnerMU: Sally JaraMW: Myriam ArévalosMI: Jéssica ServínME: Sendy Cáceres← 20132015 → The Nuestra Belleza Paraguay 2014 pageant was held at the Yacht & Golf Club Paraguayo on September 13, 2014, to select Paraguayan representatives to the fo...

 

Statistical concept In statistics, missing data, or missing values, occur when no data value is stored for the variable in an observation. Missing data are a common occurrence and can have a significant effect on the conclusions that can be drawn from the data. Missing data can occur because of nonresponse: no information is provided for one or more items or for a whole unit (subject). Some items are more likely to generate a nonresponse than others: for example items about private subjects s...

 

Port in AustraliaPortside at Portside WharfClick on the map for a fullscreen viewLocationCountry AustraliaLocationHamilton, Brisbane, QueenslandDetailsOperated byBrookfieldOwned byBrookfieldType of harbourNatural/ArtificialSize270 m (890 ft)No. of berths1No. of wharfs1StatisticsWebsitePort Side Wharf Cruise Terminal 'Portside Wharf residential and retail development at Hamilton, Brisbane, Queensland, Australia. Portside is an upscale residential and retail precinct including restau...

土库曼斯坦总统土库曼斯坦国徽土库曼斯坦总统旗現任谢尔达尔·别尔德穆哈梅多夫自2022年3月19日官邸阿什哈巴德总统府(Oguzkhan Presidential Palace)機關所在地阿什哈巴德任命者直接选举任期7年,可连选连任首任萨帕尔穆拉特·尼亚佐夫设立1991年10月27日 土库曼斯坦土库曼斯坦政府与政治 国家政府 土库曼斯坦宪法 国旗 国徽 国歌 立法機關(英语:National Council of Turkmenistan) ...

 

Namesake of Stanford University Leland Stanford Jr.Leland Stanford in 1872BornLeland DeWitt Stanford(1868-05-14)May 14, 1868Sacramento, California, U.S.DiedMarch 13, 1884(1884-03-13) (aged 15)Florence, ItalyKnown forNamesake of Stanford UniversityParentsLeland Stanford (father)Jane Stanford (mother) Leland Stanford's death mask on display at the Iris & B. Gerald Cantor Center for Visual Arts Leland Stanford Jr. (May 14, 1868 – March 13, 1884), known as Leland DeWitt Stanford u...

 

9th-century Italian prince SicardPrince of BeneventoContemporary effigy of Prince Sicard, from one of his solidiReign832–839PredecessorSico ISuccessorRadelchis IDied839 Sicard (died 839) was the Prince of Benevento from 832. He was the last prince of a united Benevento which covered most of the Mezzogiorno. On his death, the principality descended into civil war which split it permanently (except for very briefly under Pandulf Ironhead from 977 to 981). He was the son and successor of the S...

يفتقر محتوى هذه المقالة إلى الاستشهاد بمصادر. فضلاً، ساهم في تطوير هذه المقالة من خلال إضافة مصادر موثوق بها. أي معلومات غير موثقة يمكن التشكيك بها وإزالتها. (يوليو 2019) الحدثكأس الكؤوس الأوروبية 1975–76 نادي رويال أندرلخت وست هام يونايتد 4 2 التاريخ5 مايو 1976  الملعبملعب المل�...

 

SatandoKoordinat4°46′19.000″LS,119°26′50.000″BTNegaraIndonesiaGugus kepulauanSpermondeProvinsiSulawesi SelatanKabupatenPangkajene dan KepulauanLuas55.668,8717392 m² Nomor 32 menunjukkan lokasi Pulau Satando Satando adalah nama sebuah pulau kecil berpenghuni yang berada di gugusan Kepulauan Spermonde, perairan Selat Makassar dan secara administratif masuk pada wilayah Desa Mattiro Baji, Kecamatan Liukang Tupabbiring Utara, Kabupaten Pangkajene dan Kepulauan, Sulawesi Selatan, I...

 

Bridge in Kahnawake and Montreal, QuebecHonoré Mercier BridgeThe twin spans of the Mercier Bridge as seen from Lasalle in 2008.Coordinates45°25′01″N 73°39′18″W / 45.417°N 73.655°W / 45.417; -73.655Carries R-138CrossesSt. Lawrence River and Saint Lawrence SeawayLocaleKahnawake and Montreal, QuebecOfficial namePont Honoré-MercierCharacteristicsDesignTwin through arch bridgesTotal length1.361 km (0.846 mi)HeightVaries from12.44 to 33.38 m (40....

This article is about the city. For the Saudi Aramco residential compound, see Saudi Aramco Residential Camp in Dhahran. This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Dhahran – news · newspapers · books · scholar · JSTOR (April 2013) (Learn how and when to remove this message) City in Eastern Province, Sau...

 

U.S. House district for Tennessee Tennessee's 4th congressional districtInteractive map of district boundaries since January 3, 2023Representative  Scott DesJarlaisR–JasperDistribution43.84% ruralPopulation (2022)796,991[1]Median householdincome$65,227[1]Ethnicity75.9% White9.2% Black8.1% Hispanic4.3% Two or more races2.0% Asian0.7% otherCook PVIR+22[2] The 4th congressional district of Tennessee is a congressional district in southern Tennessee. It has been rep...

 

Professional wrestling match type This article is about the professional wrestling match. For the pay-per-view event named after this match, see WWE Hell in a Cell. The Hell in a Cell structure at the Hell in a Cell event in October 2017 Hell in a Cell is a professional wrestling steel cage-based match which originated in 1997 in the World Wrestling Federation (WWF, now WWE). It features a large cell structure, a five-sided cuboid made from open-weave steel mesh chain-link fencing which enclo...

Miju Mishmi women from Anjaw district in their traditional attire In Northeastern India, the Miju Mishmi, also known as Kaman or Kammaan, are one of the three tribes of the Mishmi people of Tibet and Arunachal Pradesh. Members of this tribe are located in Anjaw and Lohit district. The Miju clans claim to have come from the Kachin country of Burma. They speak languages of the Midzu branch of Tibeto-Burman. Origin The origin of the tribe is unknown, since the tribe does not have written records...

 

Not to be confused with Our Lady of Fatima Higher Secondary School, Aligarh. This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Our Lady of Fatima High School – news · newspapers · books · scholar · JSTOR (January 2015) (Learn how and when to remove this message) Private, coeducational school in Warren, , Rhode...

 

Ban the Box is an American campaign by advocates for ex-offenders aimed at removing the check box that asks if applicants have a criminal record from hiring applications. Its purpose is to enable ex-offenders to display their qualifications in the hiring process before being asked about their criminal records. The premise of the campaign is that anything that makes it harder for ex-offenders to find a job makes it likelier that they will reoffend, which is bad for society. History The campaig...

This is the 1109 German-Polish War. For a list of all Polish-German Wars, see Polish-German Wars.This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Henry V's expedition to Poland – news · newspapers · books · scholar · JSTOR (January 2024) (Learn how and when to remove this message) Henry V's expedition to Pola...

 

This article relies largely or entirely on a single source. Relevant discussion may be found on the talk page. Please help improve this article by introducing citations to additional sources.Find sources: Alabama Sports Hall of Fame – news · newspapers · books · scholar · JSTOR (May 2015) Sports museum in Alabama, United StatesAlabama Sports Hall of FameEstablishedAugust 14, 1967LocationBirmingham, Alabama, United StatesTypeSports museumCollection size...