Нейронный газ

Деление нейрона с максимальной ошибкой в «расширяющемся нейронном газе»

Расширяющийся нейронный газ — «это алгоритм, позволяющий осуществлять адаптивную кластеризацию входных данных, то есть не только разделить пространство на кластеры, но и определить необходимое их количество исходя из особенностей самих данных. Расширяющийся нейронный газ не требует априорной информации о данных, таких как оценка количества кластеров или форма кластеров.»[1] Это новый класс вычислительных механизмов. Количество и расположение искусственных нейронов в пространстве признаков заранее не определено, а является результатом вычисления в процессе обучения моделей на основании данных введенных на входе[2]. В данной модели не фиксировано соседство узлов, а динамически меняется по мере улучшения кластеризации. Переменными являются не только отношения соседства, но и число нейронов-кластеров.

История создания

Существуют методики, которые способны выделять наиболее похожие объекты в пространстве и формировать из них группы. В процессе анализа множество объектов организуется в подмножества на основе измеряемого сходства. Обычно методы основываются на стандартной схеме: оптимизация отношений между пространственным расположением векторов и множества объектов, таких, что каждый вектор определяет структуру кластеров. Однако большинство техник имеют два значительных недостатка: проведение анализа зависит от заданного количества кластеров и разделения на кластеры локализовано во времени. Все современные методы кластеризации были статичны и не могли адаптировать результаты, если к данным добавлялись новые данные, необходимо было повторно выполнять алгоритм.

Описание алгоритма

Реализация алгоритма начинается с двух нейронов. Далее происходит последовательное изменение (обычно в сторону увеличения) их числа, одновременно создаются связи между нейронами, наилучшим образом отвечающий распределению входных векторов. Каждому нейрону присваивается внутренняя переменная, в которой накапливается «локальная ошибка». Соединения между узлами описывается переменной, называемой «возраст»[3].

  • Сперва создаются два узла (здесь и далее, узел=нейрон) с векторами весов, разрешенными распределением входных векторов, и нулевыми значениями локальных ошибок;
  • Узлы соединяются связью, которой можно установить возраст. На начальном этапе возраст равен 0.
  • Затем на вход нейросети подаётся вектор .
  • На следующем этапе находятся два нейрона и , ближайших к ( ближе, чем ), то есть узлы с векторами весов и , такими, что - минимальное, а — второе минимальное значение расстояния среди всех узлов.
  • Обновляется локальная ошибка наиболее близкого нейрона — победителя , к ней добавляется квадрат расстояния между векторами и .
  • При реализации этой процедуры наиболее часто выигрывающие узлы (в их окрестности попадает максимальное число входных сигналов) получают наибольшее значение ошибки. Эти области «уплотняются» в первую очередь и происходит это за счеёт добавления новых узлов.
  • Нейрон-победитель и все его топологические соседи (то есть все нейроны , имеющие соединение с победителем) смещаются в сторону входного вектора на расстояния, равные долям и от полного.

Если на этом этапе узлы смещаются в сторону входного вектора, то победитель стремится «усреднить» своё положение относительно входных сигналов, расположенных в его окрестностях. При этом лучший нейрон слегка «подтягивает» соседние нейроны в сторону сигнала.

  • Увеличить на 1 возраст всех соединений, исходящих от победителя .
  • Если два лучших нейрона и соединены, то требуется обнулить возраст их связи. Иначе нужно создать связь между ними.
  • Удалить все связи, возраст которых превышает максимальный возраст. Нейроны, у которых нет связей с другими узлами удаляются.
  • Если номер текущей итерации кратен , и предельный размер сети не достигнут требуется создать новый нейрон по правилам. Со временем после нескольких циклов смещений накапливается информация, на основании которой принимается решение о месте, в котором должен быть добавлен новый нейрон. В ходе этого процесса происходит коррекция переменных ошибок всех нейронов слоя. В результате этого сеть «забывает» старые входные векторы и лучше реагирует на новые. Появляется возможность использования Расширяющегося нейронного газа для подстройки нейросети под медленно дрейфующие распределения входных сигналов.
  • Найти нейрон с максимальной локальной ошибкой.
  • Среди соседей найти нейрон с самой большой ошибкой.
  • Создать узел «посередине» между и :
  • Заменить связь между и на связи между и , и .
  • Уменьшить ошибки нейронов и , установить значение ошибки нейрона .
  • Большое значение этой ошибки служит указанием на то, что соответствующий нейрон лежит в области небольшого числа нейронов.
  • Каждый раз, когда для случайно выбранного определяется ближайший к нему нейрон , локальная ошибка для последнего получает приращение .

Форма структуры данных

Исследователь может сам задавать форму структуры кластеров, будет ли кластеризация выполнена для гиперсферы, гипертрубы или гиперплоскости. Если он не обладает этими знаниями, то благодаря значению собственной ковариационной матрицы можно определить необходимую форму. Если структура имеет хотя бы одно собственное значение меньше выбранного пользователем порога, то модель будет гиперлинейной, в противном случае структуру необходимо рассматривать как нелинейное многообразие. Дальнейшая проверка покажет, имеет ли модель форму сферы или трубы. Проверка на сферичность зависит от выполнения неравенства np/na>ψ, где np — это количество векторов внутри скопления, которое находится с помощью теоремы Жордана Брауера[4], а ap — площадь поверхности скопления и ψ — заданный пользователем порог. Если это неравенство приобретает форму np/na<ψ, то формой кластера будет «гипертруба».[3]

Расстояние от вектора Х до нейронов в кластерах разной формы

Для кластера в виде гипертрубы рассчитывается радиальная мера расстояния:

Для кластера в виде гипертрубы рассчитывается радиальная мера расстояния

где Aj — это положительной, определённой матрица, посчитанная для учёта эксцентриситета и ориентации гипертрубы[5]. Значение Aj для этого уравнения находится с помощью гиперлипсоида Лоунера, используя алгоритм Хачияна[6].

Для определения расстояний в гиперплоскости следует использовать следующую формулу: Формула для определения расстояний в гиперплоскости

где Aj, это сколь угодно позитивно определённая симметричная матрица весов. А bj, k оценивается с помощью нахождения собственных векторов нейронных узлов модели.

Для определения расстояния в гиперсфере необходимо использовать формулу: Формула для определения расстояний в гиперсфере

где wi — либо среднее значение векторов, заключённых в плоскости.

Визуализация данных

В трёхмерном пространстве данные очень легко визуализировать.[3] Вы можете видеть это на рисунке.

Визуализация в 3d пространстве

Однако если наше пространство больше, чем трёхмерное, то визуализация данных затруднительна. Для решения этой задачи используется техника, основанная на VAT[7]. Суть построения заключается в том, что находится минимальное остовное дерево модели. После того как завершён процесс сортировки, структуру кластеров можно анализировать по квадратам около диагонали. Сперва происходит вычисление нормированных, попарно-различающихся нейронов в каждом изолированном графе. Затем различающиеся нейроны перестраиваются для того чтобы создать наиболее плотное внутрикластерное распределение. Затем каждый кластер окрашивается в свой цвет и размещается вдоль главной диагонали. Внутрикластерные отношения также включены в диаграмму, максимальное расстояние между двумя кластерами обозначено белым цветом, а чёрным — наименьшее расстояние. Объём кластера может быть добавлен как ещё одно измерение, это высота квадратов.

Решение проблем визуализации

Пример использования расширяющегося нейронного газа

Этот пример представлен для демонстрации того, как система адаптируется при вводе новых данных. База данных представляет собой 1050 объектов-точек. В начале было проведено 5000 итераций и в алгоритм попало 75 % информации. После того, как небольшая часть — 756 точек данных были введены в систему, нейронные векторы начали адаптироваться к формированию распределения, показанного на рисунке ниже. Последовательное выполнение алгоритма

После чего было запущено ещё 150 новых векторов. Это привело к формированию нового сферического класса, обозначенного на рисунке ниже: 4 кл

Несмотря на пространственную близость зелёного и пурпурного кластеров, алгоритм отметил увеличение кластеров и адаптировался к этим изменениям. В данном случае оставшиеся 120 объектов были многократно перемешаны между зелёным и пурпурным кластером. Алгоритм впоследствии распределил данные между двумя кластерами и сохранил первоначальное число кластеров.

3 кл

Примечания

  1. Словарь Neural.ru. Дата обращения: 15 июня 2012. Архивировано 24 июля 2012 года.
  2. Растущий нейронный газ — реализация на языке программирования MQL5. Дата обращения: 15 июня 2012. Архивировано 16 июня 2012 года.
  3. 1 2 3 Isaac J. Sledge,Growing Neural Gas for Temporal Clustering/IEEE, 2008
  4. M. Berg, M. Kreveld, M. Overmars, O. Schwarzkopf, Computational Geometry, Springer-Verlag, New York, 2000.
  5. G. Carpenter, «Competitive Learning: From Interactive Activation to Adaptive Resonance», Cognitive Science, vol. 11, 1987.
  6. L. Khachiyan, M. Todd, «On the Complexity of Approximating the Maximal Inscribed Ellipsoid for a Polytope», Math. Prog., 1993.
  7. J. Keller, I. Sledge, «A Cluster By Any Other Name», IEEE Proc., NAFIPS, 2007.

См. также

  1. T. Martinetz, Neural Gas Network for Vector Organization and its application to time-serias prediction/IEEE, vol. 4, 1993
  2. T. Martinetz, Neural Gas Network learns topologies.

Read other articles:

Peta infrastruktur dan tata guna lahan di Komune Frain.  = Kawasan perkotaan  = Lahan subur  = Padang rumput  = Lahan pertanaman campuran  = Hutan  = Vegetasi perdu  = Lahan basah  = Anak sungaiFrain merupakan sebuah komune di departemen Vosges yang terletak pada sebelah timur laut Prancis. Lihat pula Komune di departemen Vosges Referensi INSEE Diarsipkan 2007-11-24 di Wayback Machine. lbsKomune di departemen Vosges Les Ableuvenettes Ahéville Aingevill...

 

Ernesto Che Guevara (14 Juni 1928 – 9 Oktober 1967), adalah revolusioner Marxis, politikus, pengarang, intelektual, dokter, teoriwan militer, dan pemimpin gerilya asal Argentina. Kehidupannya, warisannya, dan gagasannya menarik perhatian sejarawan, seniman, pembuat film, musisi, dan penulis biografi. Mengenai banyaknya bahan tentang Guevara, Gabriel García Márquez, pengarang pemenang Hadiah Nobel, menyatakan bahwa butuh seribu tahun dan sejuta halaman untuk menyelesaikan biografi Che. Ber...

 

Drive to maintain and enhance favorable views of oneself Not to be confused with Egoism or Egocentrism. For the 1843 short story, see Egotism; or, The Bosom-Serpent. This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Egotism – news · newspapers · books · scholar · JSTOR (January 2016) (Learn how and when to rem...

Tunisian footballer and manager Radhi Jaïdi Jaïdi in 2019Personal informationFull name Radhi Ben Abdelmajid Jaïdi[1]Date of birth (1975-08-30) 30 August 1975 (age 48)Place of birth Gabès,[1] TunisiaHeight 1.92 m (6 ft 4 in)Position(s) Centre backYouth career1988–1992 Stade Gabèsien1992–1993 Espérance de TunisSenior career*Years Team Apps (Gls)1993–2004 Espérance de Tunis 288 (20)2004–2006 Bolton Wanderers 43 (8)2006–2009 Birmingham City 86 ...

 

Dyah Gayatri atau Sri Rajapatni (lahir sekitar tahun 1275, meninggal tahun 1350) adalah putri bungsu raja Kertanagara dan salah satu istri dari Dyah Wijaya raja pertama Majapahit (1293-1309), merupakan nenek dari Hayam Wuruk. Dyah GayatriRajapatni Sri Rajendra Dyah Dewi GayatriArca Prajnaparamita dari Prajñaparamitapuri, Boyolangu, Tulungagung.Gayatri RajapatniInformasi pribadiKelahiranSekitar 1275, Istana Singhasari,Jawa TimurKematian1350Istana MajapahitPemakamandidharmakan di Prajñaparami...

 

American college basketball season 2018–19 Purdue Boilermakers men's basketballBig Ten regular season co-championsNCAA tournament, Elite EightConferenceBig Ten ConferenceRankingCoachesNo. 8APNo. 13Record26–10 (16–4 Big Ten)Head coachMatt Painter (14th season)Assistant coaches Brandon Brantley (6th season) Greg Gary (8th season) Steve Lutz (2nd season) Home arenaMackey ArenaSeasons← 2017–182019–20 → 2018–19 Big Ten Conference men's basketba...

Questa voce sull'argomento cestisti statunitensi è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. Jalen McDaniels Jalen McDaniels con la maglia di San Diego State Nazionalità  Stati Uniti Altezza 208 cm Peso 88 kg Pallacanestro Ruolo Ala grande Squadra  Toronto Raptors Carriera Giovanili Federal Way High School2017-2019 SDSU Aztecs67 (884) Squadre di club 2019-2023 Charlotte Hornets...

 

Marian shrine in Ireland Church in County Mayo, IrelandBasilica Shrine of Our Lady of Knock, Queen of IrelandCnoc MhuireSanctuary of Our Lady of KnockBasilica Shrine of Our Lady of Knock, Queen of Ireland53°47′32″N 8°55′04″W / 53.792099°N 8.917659°W / 53.792099; -8.917659LocationKnock, County MayoCountryIrelandLanguage(s)English, IrishDenominationCatholicTraditionRoman RiteWebsiteknockshrine.ieHistoryDedicationOur Lady of KnockArchitectureArchitectural type...

 

2004 single by Daddy Yankee For the Guatemalan film, see Gasolina (film). For other uses, see Gasolina (disambiguation). GasolinaSingle by Daddy Yankeefrom the album Barrio Fino LanguageSpanishB-sideMacheteReleasedOctober 2004 (2004-10)[1]GenreReggaetonLength3:12Label VI Music UMG Songwriter(s) Ramón Ayala Eddie Ávila Producer(s)Luny TunesDaddy Yankee singles chronology King Daddy (2004) Gasolina (2004) No Me Dejes Solo (2005) Music videoGasolina on YouTube Gasolina (S...

Stock car race 2006 UAW-Ford 500 Race details[1][2][3][4] Race 30 of 36 in the 2006 NASCAR Nextel Cup Series The 2006 UAW-Ford 500 program cover, featuring Dale Jarrett, winner of the 2005 race.Date October 8, 2006 (2006-October-08)Official name UAW-Ford 500Location Talladega Superspeedway, Talladega, AlabamaCourse Permanent racing facility2.66 mi (4.28 km)Distance 188 laps, 500.08 mi (804.8 km)Weather Temperatures up to 75.2 °F (24.0 ...

 

Transmission of information electromagnetically Telecommunication redirects here. For the A Flock of Seagulls song, see Telecommunication (song). Earth station at the satellite communication facility Raisting Earth Station in Raisting, Bavaria, Germany Telecommunication, often used in its plural form, is the transmission of information with an immediacy comparable to face-to-face communication. As such, slow communications technologies like postal mail and pneumatic tubes are excluded from th...

 

Building in Orpington, London Borough of Bromley UKThe Daylight InnThe Daylight Inn, 2011The Daylight InnLocation within London Borough of BromleyShow map of London Borough of BromleyThe Daylight InnThe Daylight Inn (Greater London)Show map of Greater LondonGeneral informationArchitectural style Neo-TudorLocationPetts Wood, Orpington, London Borough of Bromley UKCoordinates51°23′21″N 0°04′30″E / 51.3893°N 0.0751°E / 51.3893; 0.0751Completed1935 (Extended 1...

جون كيري (بالإنجليزية: John Kerry)‏    وزير الخارجية الأمريكي 68 في المنصب1 فبراير 2013 – 20 يناير 2017 الرئيس باراك اوباما هيلاري كلينتون ريكس تيلرسون رئيس لجنة العلاقات الخارجية في مجلس الشيوخ في المنصب6 يناير 2009 – 1 فبراير 2013 جو بايدن بوب مينينديز رئيس لجنة الأعمال التجارية...

 

Witch Watchウィッチウォッチ(Witchi Wotchi)Copertina del primo volume dell'edizione italiana, raffigurante Nico Wakatsuki Generefantasy[1], commedia romantica[2] MangaAutoreKenta Shinohara EditoreShūeisha RivistaWeekly Shōnen Jump Targetshōnen 1ª edizione8 febbraio 2021 – in corso Periodicitàsettimanale Tankōbon16 (in corso) Editore it.Star Comics Collana 1ª ed. it.Stardust 1ª edizione it.31 maggio 2023...

 

Города Финляндии — муниципальные образования Финляндии, имеющие статус города (фин. kaupunki). В 2018 году в Финляндии насчитывается 107 городов. Города в Финляндии на 2020 год Список городов Герб Название Финское название Шведское название Регион Область Население Основание �...

Often life-threatening bacterial infection Medical conditionMeningococcal diseaseCharlotte Cleverley-Bisman, one of the youngest survivors of the disease. The infected arms and legs had to be amputated later.SpecialtyInfectious disease, critical care medicineSymptomsFlu-like symptoms, stiff neck, altered mental status, seizures, purpuraComplicationsGangrene leading to amputation, sepsis, brain damage, blindness, deafnessPreventionMeningococcal vaccineTreatmentAntibioticsPrognosis10–20% mort...

 

British political organisation Labour Campaign for Electoral ReformAbbreviationLCERChairSandy MartinWebsiteOfficial websiteFormerly calledLabour Study Group for Electoral Reform The Labour Campaign for Electoral Reform (LCER) is an organisation formed of members and supporters of the British Labour Party, who are interested in issues of democratic renewal and electoral reform. LCER campaigns on a range of constitutional issues associated with accountability, democracy and governance; its flag...

 

Sicilian mathematician and astronomer (1494–1575) This article is about the Italian mathematician and astronomer. For the crater, see Maurolycus (crater). Francesco MaurolicoEngraving of Maurolico[1]Born1494Messina, Kingdom of SicilyDied1575 (aged 81)Messina, Kingdom of SicilyScientific careerFieldsMathematics, geometry, optics, conics, mechanics, music, and astronomy Francesco Maurolico (Latin: Franciscus Maurolycus; Italian: Francesco Maurolico; Greek: Φραγκίσκος Μαυ�...

Table of nutrition facts on food labels The examples and perspective in this article deal primarily with North America and do not represent a worldwide view of the subject. You may improve this article, discuss the issue on the talk page, or create a new article, as appropriate. (February 2024) (Learn how and when to remove this message) A sample nutrition facts label, with instructions from the U.S. Food and Drug Administration[1] The nutrition facts label (also known as the nutritio...

 

2013 tax increase and spending decrease This article is part of a series on theBudget and debt in theUnited States of America Major dimensions Economy Expenditures Federal budget Financial position Military budget Public debt Taxation Unemployment Gov't spending Programs Medicare Social programs Social Security Contemporary issues Bowles–Simpson Commission Bush tax cuts Debt ceiling history Deficit reduction Fiscal cliff Healthcare reform Political debates Social Security debate Starve the ...