Її часто асоціюють із моделлю автокодувальника[2][3] через її архітектурну спорідненість, але між ними є значні відмінності як у цілі, так і в математичному формулюванні. Варіаційні автокодувальники призначено для стискання інформації входу до обмеженого багатовимірного латентного розподілу (кодування), щоби відбудовувати її якомога точніше (декодування). Хоча первинно цей тип моделі було розроблено для некерованого навчання,[4][5] його дієвість було доведено й в інших областях машинного навчання, таких як напівкероване[6][7] та кероване навчання.[8]
Архітектура
Варіаційні автокодувальники є варіаційними баєсовими методами з багатовимірним розподілом як апріорне, й апостеріорним, наближуваним штучною нейронною мережею, що утворюють так звану структуру варіаційного кодувальника-декодувальника.[9][10][11]
Стандартний кодувальник є штучною нейронною мережею, здатною зводити свою вхідну інформацію до найвужчого подання, що називають латентним простором. Він являє собою першу половину архітектури як автокодувальника, так і варіаційного автокодувальника: для першого виходом є фіксований вектор штучних нейронів, а в другому інформація виходу стискається до ймовірнісного латентного простору, що все ще складається зі штучних нейронів. Проте в архітектурі варіаційного автокодувальника вони представляють і їх розглядають як два різні вектори однакової вимірності, що подають вектор середніх значень та вектор стандартних відхилень відповідно.
Стандартний декодувальник все ще є штучною нейронною мережею, призначеною віддзеркалювати архітектуру кодувальника. Він бере на вході стиснену інформацію, що надходить із латентного простору, а потім розгортає її, виробляючи вихід, якомога ближчий до входу кодувальника. І хоча для автокодувальника вхід декодувальника є просто вектором дійсних значень фіксованої довжини, для варіаційного автокодувальника необхідно ввести проміжний етап: враховуючи ймовірнісну природу латентного простору, можливо розглядати його як багатовимірний гауссів вектор. За цього припущення й за допомогою методики, відомої як перепараметрувальний трюк (англ.reparametrization trick), можливо вибирати сукупності з цього латентного простору й розглядати їх точно як вектор дійсних значень фіксованої довжини.
З системної точки зору моделі як стандартного, так і варіаційного автокодувальників отримують як вхід набір даних великої розмірності. Потім вони адаптивно стискають його до латентного простору (кодування) і, нарешті, намагаються якомога точніше його відбудувати (декодування). Враховуючи природу його латентного простору, варіаційний автокодувальник характеризується дещо іншою цільовою функцією: він має мінімізувати функцію втрат відбудови, як і стандартний автокодувальник. Проте він також враховує розходження Кульбака — Лейблера між латентним простором та вектором нормальних гауссіан.
Формулювання
З формальної точки зору, за заданого набору даних входу , описуваного невідомою функцією ймовірності , та багатовимірного вектору латентного кодування , мета полягає в моделюванні цих даних як розподілу , де визначено як набір параметрів мережі.
Цей розподіл можливо формалізувати як
де є свідченням даних цієї моделі з відособленням, виконаним над неспостережуваними змінними, й відтак подає спільний розподіл даних входу та їхнього латентного подання відповідно до параметрів мережі .
Відповідно до теореми Баєса, це рівняння можливо переписати як
У стандартному варіаційному автокодувальнику ми вважаємо, що має скінченну розмірність, і що є гауссовим розподілом, тоді є сумішшю гауссових розподілів.
Тепер можливо визначити набір взаємозв'язків між даними входу та їх латентним поданням як
Апріорне
Правдоподібність
Апостеріорне
На жаль, обчислення є дуже витратним, і в більшості випадків навіть непіддатливим. Щоби пришвидшити це обчислення й зробити його здійсненним, необхідно ввести додаткову функцію для наближення апостеріорного розподілу:
де визначено як набір дійсних значень, що параметрує .
Таким чином загальну задачу можливо легко перевести до області визначення автокодувальника, в якому розподіл умовної правдоподібності провадиться імовірнісним кодувальником (англ.probabilistic encoder), а наближений апостеріорний розподіл обчислюється імовірнісним декодувальником (англ.probabilistic decoder).
Для варіаційних автокодувальників ідея полягає в спільному мінімізуванні параметрів породжувальної моделі , щоби зменшувати похибку відбудови між входом і виходом мережі, та , щоби мати якомога ближчою до .
Як втрати відстані між цими двома розподілами, добрим вибором, щоби втискувати під , є обернене розходження Кульбака — Лейблера .[1][12]
Щойно визначені втрати відстані розкриваються як
На цьому етапі можливо переписати це рівняння як
Метою є максимізувати логарифмічну правдоподібність лівої частини цього рівняння для поліпшення якості породжуваних даних та мінімізування відстаней між розподілами справжнього та оцінюваного апостеріорних.
Це є рівнозначним мінімізуванню від'ємної логарифмічної правдоподібності, що є типовою практикою в задачах оптимізації.
Отриману таким чином функцію втрат, яку також називають функцією втрат нижньої межі свідчення[en] (англ.evidence lower bound), скорочено НМЕС (англ.ELBO), можливо записати як
Враховуючи властивість невід'ємності розходження Кульбака — Лейблера, буде правильним стверджувати, що
Оптимальними параметрами є ті, які мінімізують цю функцію втрат. Цю задачу можливо узагальнити як
Основна перевага цього формулювання полягає в можливості спільного оптимізування за параметрами та .
Перш ніж застосовувати функцію втрат НМЕС до задачі оптимізування для зворотного поширення градієнта, необхідно зробити її диференційовною, застосувавши так званий трюк перепараметрування (англ.reparameterization trick), щоб усунути стохастичне вибирання з цього формування, й таким чином зробити її диференційовною.
Трюк перепараметрування
Щоб зробити формулювання НМЕС придатним для цілей тренування, необхідно ввести подальшу незначну зміну до формулювання задачі, а також до структури варіаційного автокодувальника.[1][13][14]
Стохастичне вибирання є недиференційовною операцією, через яку можливо вибирати з латентного простору й подавати на ймовірнісний декодувальник.
Щоб уможливити застосування процесів зворотного поширення, таких як стохастичний градієнтний спуск, запроваджують трюк перепараметрування.
Основним припущенням про латентний простір є те, що його можливо розглядати як сукупність багатовимірних гауссових розподілів і, отже, можливо описати як
Якщо , а визначено як поелементний добуток, то трюк перепараметрування змінює наведене вище рівняння до
.
Завдяки цьому перетворенню, яке можливо поширити й на інші розподіли, відмінні від гауссового, варіаційний автокодувальник піддається тренуванню, а ймовірнісний кодувальник має навчатися відображувати стиснене подання вхідних даних у два латентні вектори та , тоді як стохастичність залишається виключеною з процесу уточнювання, й вводиться до латентного простору як зовнішній вхід через випадковий вектор .
Різновиди
Існує багато застосувань і розширень варіаційних автокодувальників для пристосовування цієї архітектури до різних областей та поліпшення її продуктивності.
β-ВАК (англ.β-VAE) є втіленням зі зваженим членом розходження Кульбака — Лейблера для автоматичного виявляння та інтерпретування розкладених латентних подань. За допомогою цього втілення можливо нав'язувати розплутування многовиду для значень , більших за одиницю. Автори показали здатність цієї архітектури породжувати високоякісні синтетичні зразки.[15][16]
Ще одне втілення, назване умовним варіаційним автокодувальником (англ.conditional variational autoencoder), скорочено УВАК (англ.CVAE), як вважають, вставляє міткову інформацію до латентного простору, нав'язуючи детерміноване обмежене подання навчених даних.[17]
Деякі структури безпосередньо займаються якістю породжуваних зразків[18][19] або втілюють понад одного латентного простору для подальшого поліпшення навчання подань.[20][21]
Деякі архітектури поєднують структури варіаційних автокодувальників та породжувальних змагальних мереж, щоб отримувати гібридні моделі з високими породжувальними спроможностями.[22][23][24]
↑Dilokthanakul, Nat; Mediano, Pedro A. M.; Garnelo, Marta; Lee, Matthew C. H.; Salimbeni, Hugh; Arulkumaran, Kai; Shanahan, Murray (13 січня 2017). Deep Unsupervised Clustering with Gaussian Mixture Variational Autoencoders. arXiv:1611.02648 [cs.LG]. (англ.)
↑Dai, Bin; Wipf, David (30 жовтня 2019). Diagnosing and Enhancing VAE Models. arXiv:1903.05789 [cs.LG]. (англ.)
↑Dorta, Garoe; Vicente, Sara; Agapito, Lourdes; Campbell, Neill D. F.; Simpson, Ivor (31 липня 2018). Training VAEs Under Structured Residuals. arXiv:1804.01050 [stat.ML]. (англ.)
↑Tomczak, Jakub; Welling, Max (31 березня 2018). VAE with a VampPrior. International Conference on Artificial Intelligence and Statistics(англ.). PMLR: 1214—1223. arXiv:1705.07120. Архів оригіналу за 24 червня 2021. Процитовано 3 липня 2021. (англ.)
↑Razavi, Ali; Oord, Aaron van den; Vinyals, Oriol (2 червня 2019). Generating Diverse High-Fidelity Images with VQ-VAE-2. arXiv:1906.00446 [cs.LG]. (англ.)
Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada Desember 2023. Lloyd IsgroveInformasi pribadiNama lengkap Lloyd Jeffrey IsgroveTanggal lahir 12 Januari 1993 (umur 31)Tempat lahir Yeovil, InggrisTinggi 1,78 m (5 ft 10 in)Posisi bermain GelandangInformasi klubKlub saat ini SouthamptonNomor 39Kar...
Untuk kegunaan lain, lihat Sumatra (disambiguasi). SumatraNama lokal: سومترا (Jawi)Topografi Pulau SumatraPulau Sumatra di IndonesiaGeografiLokasiAsia TenggaraKoordinat0°00′N 102°00′E / 0.000°N 102.000°E / 0.000; 102.000KepulauanKepulauan Sunda BesarLuas473.481 km2Peringkat luaske-6Titik tertinggiGunung Kerinci (3.805 m)PemerintahanNegara IndonesiaProvinsi Aceh Sumatera Utara Sumatera Barat Riau Jambi ...
WeisshornLa parete sud, nel mese di giugno. A destra la cresta est.Stato Svizzera Cantone Vallese Altezza4 505 m s.l.m. Prominenza1 235 m Isolamento11 km CatenaAlpi Coordinate46°06′04.68″N 7°42′57.6″E / 46.101299°N 7.716001°E46.101299; 7.716001Coordinate: 46°06′04.68″N 7°42′57.6″E / 46.101299°N 7.716001°E46.101299; 7.716001 Data prima ascensione19 agosto 1861 Autore/i prima ascensioneJohn Tyndall con le...
Memorial structure in Shiraz, Iran Hafeziyeh (Tomb of Hafez)Hāfeziyeh29°37′31.45″N 52°33′29.95″E / 29.6254028°N 52.5583194°E / 29.6254028; 52.5583194LocationShiraz, IranDesignerAndré GodardCompletion date1452 (first building)1935 (modern building)Dedicated toHafez The Tomb of Hafez (Persian: آرامگاه حافظ), commonly known as Hāfezieh (حافظیه), are two memorial structures erected in the northern edge of Shiraz, Iran, in memory of...
Chemical compound ValopicitabineClinical dataATC codeNoneLegal statusLegal status US: Investigational drug Identifiers IUPAC name [(2R,3R,4R,5R)-5-(4-amino-2-oxopyrimidin-1-yl)-4-hydroxy-2-(hydroxymethyl)-4-methyloxolan-3-yl] (2S)-2-amino-3-methylbutanoate CAS Number640281-90-9PubChem CID6918726DrugBankDB13920ChemSpider5293918UNIII2T0B5G94MKEGGD09028ChEMBLChEMBL1743757CompTox Dashboard (EPA)DTXSID70214011 Chemical and physical dataFormulaC15H24N4O6Molar mass356.379 g·mol−13D mode...
Ini adalah nama Korea; marganya adalah Park. Park Bo-ramPark Boram pada Mei 2015Nama asal박보람LahirPark Bo-ram(1994-03-01)1 Maret 1994Chuncheon, Gangwon, Korea SelatanMeninggal11 April 2024(2024-04-11) (umur 30)Rumah Sakit Guri Universitas Hanyang [ko], Gyomun-dong [ko], Guri, Gyeonggi, Korea SelatanPekerjaanPenyanyiKarier musikGenreK-popR&BInstrumenVokalTahun aktif2010–2024LabelStone Music Entertainment (MMO Entertainment)Nama KoreaHangul박보�...
2024 Paris Olympic event Athleticsat the Games of the XXXIII OlympiadVenueStade de France (track and field events)Pont d'Iéna (race walk)Hôtel de Ville and Les Invalides (Marathon)Dates1–11 August 2024No. of events48Competitors1,810← 20202028 → Athletics at the2024 Summer OlympicsQualificationTrack events100 mmenwomen200 mmenwomen400 mmenwomen800 mmenwomen1500 mmenwomen5000 mmenwomen10,000 mmenwomen100 m hurdleswomen110 m hurdlesmen400 m hurdlesmenwomen3000 m steeple...
Theatre in the Community of Madrid, Spain Corral de comedias de Alcalá de Henares1602AddressPlaza de Cervantes, 14Alcalá de HenaresSpainCoordinates40°28′56″N 3°21′52″W / 40.482303°N 3.364571°W / 40.482303; -3.364571OperatorFundación Teatro La AbadíaCapacity200ConstructionRebuilt1769ArchitectFrancisco SánchezWebsitehttp://www.corraldealcala.com Logo Corral de Comedias de Alcalá de Henares in Alcalá de Henares, Community of Madrid, Spain, is one of the...
Artikel ini mungkin mengandung riset asli. Anda dapat membantu memperbaikinya dengan memastikan pernyataan yang dibuat dan menambahkan referensi. Pernyataan yang berpangku pada riset asli harus dihapus. (Pelajari cara dan kapan saatnya untuk menghapus pesan templat ini) Artikel ini tidak memiliki referensi atau sumber tepercaya sehingga isinya tidak bisa dipastikan. Tolong bantu perbaiki artikel ini dengan menambahkan referensi yang layak. Tulisan tanpa sumber dapat dipertanyakan dan dihapus ...
Australian railway magazine This article relies excessively on references to primary sources. Please improve this article by adding secondary or tertiary sources. Find sources: Light Railways – news · newspapers · books · scholar · JSTOR (April 2014) (Learn how and when to remove this message) Light RailwaysEditorBruce BelbinCategoriesRail transportFrequencyBimonthlyFirst issueJune 1960CompanyLight Railway Research Society of AustraliaCountryAustraliaB...
Halaman ini berisi artikel tentang roti tipis. Untuk kegunaan lain, lihat Pita (disambiguasi). Lihat pula: Roti Tandoor PitaDaerahTimur Tengah, Balkan, YunaniBahan utamaTepung dan airSunting kotak info • L • BBantuan penggunaan templat ini Buku resep: Pita Media: Pita Pita atau pitta (/[invalid input: 'icon']ˈpɪtə/ PI-tə) adalah sebuah roti kosong bulat yang banyak dikonsumsi dalam berbagai masakan Timur Tengah, Mediterania, dan Balkan. Roti ini terkenal di Yunani,...
Colombian film director Ciro GuerraGuerra in 2017Born (1981-02-06) 6 February 1981 (age 43)Río de Oro, ColombiaOccupation(s)Film directorScreenwriterYears active1998–present Ciro Guerra (born 6 February 1981) is a Colombian film director and screenwriter. He is best known for his 2015 film Embrace of the Serpent, which was nominated for Best Foreign Language Film at the 88th Academy Awards, and for The Wind Journeys, selected as the Colombian entry for the Best Foreign Language F...
Mk 23TAS Mk 23 blank300.png|1px]]РЛС Mk 23 (в центре) на авианосце CVN-65 «Энтерпрайз» Основная информация Тип Двухкоординатная РЛС воздушного обзора Страна США Производитель Hughes Ground Systems Group (ныне Raytheon) Статус Действующий Параметры Диапазон частот L[1]1215–1400 МГц[2] Частота импульс�...
Reinhardsmunstercomune Reinhardsmunster – Veduta LocalizzazioneStato Francia RegioneGrand Est Dipartimento Basso Reno ArrondissementSaverne CantoneSaverne TerritorioCoordinate48°41′N 7°19′E48°41′N, 7°19′E (Reinhardsmunster) Altitudine240 e 624 m s.l.m. Superficie18,3 km² Abitanti479[1] (2009) Densità26,17 ab./km² Altre informazioniCod. postale67440 Fuso orarioUTC+1 Codice INSEE67391 CartografiaReinhardsmunster Sito istituzionaleModifica dati ...