Rete generativa avversaria

Una rete generativa avversaria (in inglese generative adversarial network o GAN) è una classe di metodi di apprendimento automatico, introdotta per la prima volta da Ian Goodfellow,[1] in cui due reti neurali vengono addestrate in maniera competitiva nel contesto di un gioco a somma zero. Questo tipo di framework permette alla rete neurale di apprendere come generare nuovi dati aventi la stessa distribuzione dei dati usati in fase di addestramento. Ad esempio, è possibile ottenere una rete neurale in grado di generare volti umani iperrealistici,[2] come dimostrato nel 2018 da NVIDIA, azienda produttrice di GPU.

La rete generativa avversaria è detta anche rete antagonista generativa o rete contraddittoria generativa.

Metodo

Rete generativa avversaria

Nella sua versione originale, una rete generativa avversaria è composta da due componenti: un modello generativo, o generatore , e un modello discriminativo, o discriminatore , entrambi realizzati tramite reti neurali. Lo scopo del modello generativo è quello di produrre nuovi dati, mentre il modello discriminativo apprende come distinguere i dati reali da quelli generati artificialmente. In particolare, dato uno spazio latente , avente una distribuzione a priori , il generatore rappresenta una funzione differenziabile che fornisce in output i nuovi dati secondo una certa distribuzione , dove sono i parametri del modello generativo. Il discriminatore rappresenta una funzione differenziabile , dove sono i parametri del modello discriminativo, che produce in output la probabilità che provenga dalla distribuzione dei dati di addestramento . Lo scopo è quello di ottenere un generatore che sia un buono stimatore di . Quando questo avviene, il discriminatore viene "ingannato" e non riesce più a distinguere i campioni provenienti da da quelli provenienti da .

La chiave per raggiungere questa situazione è l'addestramento competitivo. La rete discriminativa viene addestrata in modo da massimizzare la probabilità di classificare correttamente i campioni provenienti dai dati di addestramento e i campioni generati. Allo stesso tempo, la rete generativa viene addestrata minimizzando

,

e massimizzando quindi la probabilità del discriminatore di considerare i campioni prodotti dalla rete generativa, ovvero , come provenienti da .

L'apprendimento consiste quindi nell'ottimizzare un gioco minimax a due giocatori (D e G):

,

che ha un ottimo globale per .[1]

Le due reti vengono addestrate in maniera alternata tramite retropropagazione dell'errore, mantenendo invariati i parametri del modello generativo durante l'addestramento del discriminatore e, viceversa, mantenendo invariati i parametri della rete discriminativa durante l'addestramento del generatore.

Varianti

Negli ultimi anni si è assistito ad un rapido sviluppo di metodi che rappresentano versioni modificate del framework originale.

Rete generativa avversaria condizionata

Una rete generativa avversaria condizionata, o in inglese conditional generative adversarial network (cGAN), è un'estensione della GAN in cui sia il generatore che il discriminatore vengono condizionati tramite l'utilizzo di qualche tipo di informazione aggiuntiva . La funzione obiettivo diventa:

.

Ad esempio, è possibile generare una nuova immagine di una specifica cifra scritta a mano fornendo l'etichetta relativa alla sua classificazione, ovvero uno scalare in , come input addizionale alle due reti,[3] oppure generare automaticamente immagini di ambienti esterni a partire da un layout semantico della scena.[4] In generale, i possibili campi applicativi ricadono nel dominio dei problemi di traduzione di un'immagine in un'altra:[5][6] generazione di foto realistiche a partire da etichette semantiche, generazione di immagini aeree a partire da mappe urbane (ad esempio Google Maps), generazione di immagini realistiche a partire dai contorni della scena o da uno disegno, inpainting, e molti altri.

VAE-GAN

Questa classe di metodi si basa sull'unione di autoencoder variazionali, o in inglese variational autoencoders (VAE), e le GAN. In generale, un discriminatore viene usato per distinguere tra gli esempi forniti in output dal VAE e quelli reali. In questo modo, invece di usare una funzione di errore definita, il discriminatore permette di apprendere una funzione di similarità tra l'esempio ricostruito in uscita dal VAE e quello fornito in input. Questo approccio fa sì che si ottengano ricostruzioni migliori rispetto al singolo VAE.[7]

cycleGAN

Una cycleGAN, dall'inglese cycle-consistent generative adversarial network,[8] è un'evoluzione della rete generativa avversaria in cui l'addestramento avviene in maniera non supervisionata. In questo modo è possibile apprendere un modello capace di tradurre un'immagine da un dominio ad un altro , e viceversa, senza dover utilizzare immagini target, spesso non disponibili, durante la fase di addestramento. Il modello è composto da due generatori e per tradurre, rispettivamente, immagini dal dominio al dominio e viceversa, e da due discriminatori, e , per distinguere tra gli esempi generati e quelli reali per ciascun dominio. Durante l'addestramento, in aggiunta alla classica funzione obiettivo avversaria, viene minimizzata la seguente funzione di consistenza:

.

L'idea è che, date due immagini e , applicando i due generatori in cascata e si ottengono di nuovo le rispettive immagini e . Questo tipo di modello viene applicato con successo in problemi in cui non esistono dati di addestramento accoppiati, ovvero in cui non è disponibile per ogni elemento di un dominio il suo corrispettivo nel dominio target (es., trasferimento dello stile da un'immagine ad un'altra).

Altre varianti

Sono presenti molte altre varianti del framework principale. In particolare, numerosi metodi si sono specializzati a seconda del dominio applicativo che differiscono sia dal punto di vista dell'architettura della rete che per la funzione obiettivo adottata durante l'addestramento. Lo sviluppo delle reti generative avversarie è avvenuta soprattutto nel campo della visione artificiale, in cui sono state fortemente impiegate sin dalla loro prima apparizione.[9]

Note

  1. ^ a b Ian Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville e Yoshua Bengio, Generative Adversarial Nets (PDF), in Z. Ghahramani, M. Welling, C. Cortes, N. D. Lawrence, K. Q. Weinberger (a cura di), Advances in Neural Information Processing Systems 27, Curran Associates, Inc., 2014, pp. 2672–2680. URL consultato il 2 luglio 2019.
  2. ^ Tero Karras, Samuli Laine e Timo Aila, A Style-Based Generator Architecture for Generative Adversarial Networks, in arXiv:1812.04948 [cs, stat], 12 dicembre 2018. URL consultato il 2 luglio 2019.
  3. ^ Mehdi Mirza e Simon Osindero, Conditional Generative Adversarial Nets, in arXiv:1411.1784 [cs, stat], 6 novembre 2014. URL consultato il 3 luglio 2019.
  4. ^ Levent Karacan, Zeynep Akata, Aykut Erdem e Erkut Erdem, Learning to Generate Images of Outdoor Scenes from Attributes and Semantic Layouts, in arXiv:1612.00215 [cs], 1º dicembre 2016. URL consultato il 4 luglio 2019.
  5. ^ Phillip Isola, Jun-Yan Zhu, Tinghui Zhou e Alexei A. Efros, Image-to-Image Translation with Conditional Adversarial Networks, in arXiv:1611.07004 [cs], 21 novembre 2016. URL consultato il 4 luglio 2019.
  6. ^ Chaoyue Wang, Chang Xu, Chaohui Wang e Dacheng Tao, Perceptual Adversarial Networks for Image-to-Image Transformation, in IEEE Transactions on Image Processing, vol. 27, n. 8, 2018-08, pp. 4066–4079, DOI:10.1109/TIP.2018.2836316, ISSN 1057-7149 (WC · ACNP). URL consultato il 4 luglio 2019.
  7. ^ Anders Boesen Lindbo Larsen, Søren Kaae Sønderby, Hugo Larochelle e Ole Winther, Autoencoding beyond pixels using a learned similarity metric, in arXiv:1512.09300 [cs, stat], 31 dicembre 2015. URL consultato il 5 luglio 2019.
  8. ^ Jun-Yan Zhu, Taesung Park, Phillip Isola e Alexei A. Efros, Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks, in arXiv:1703.10593 [cs], 30 marzo 2017. URL consultato il 4 luglio 2019.
  9. ^ Zhengwei Wang, Qi She e Tomas E. Ward, Generative Adversarial Networks: A Survey and Taxonomy, in arXiv:1906.01529 [cs], 4 giugno 2019. URL consultato il 5 luglio 2019.

Voci correlate

Altri progetti

Read other articles:

American magazine editor (born 1944) Terry McDonellMcDonell at Fortune Brainstorm TECH, July 2011Born (1944-08-01) August 1, 1944 (age 79)Norfolk, Virginia, United StatesOccupationMagazine editorChildrenNick McDonellThomas McDonellParentsRobert Meynard McDonell (father)Irma Sophronia Nelson (mother) Robert Terry McDonell (born August 1, 1944) is an American editor, writer and publishing executive.[1] He is a co-founder of the Literary Hub website that launched in 2015. His memoir...

 

 

Об экономическом термине см. Первородный грех (экономика). ХристианствоБиблия Ветхий Завет Новый Завет Евангелие Десять заповедей Нагорная проповедь Апокрифы Бог, Троица Бог Отец Иисус Христос Святой Дух История христианства Апостолы Хронология христианства Ран�...

 

 

Palmerston North (Māori: Te Papaioea) adalah sebuah kota utama dari distrik Manawatu-Wanganui di Pulau Utara (North Island) negara Selandia Baru. Dengan populasi sekitar 81.600 jiwa (Juni 2010), Palmerston North menjadi kota terbesar no. 7 dan jika termasuk wilayah urban kota menjadi terbesar no. 8. Kota ini meliputi area seluas 32.594 hektare. Sejarah Sekitar tahun 1350 adalah puncak migrasi masyarakat Polinesia ke Selandia Baru. Masyarakat adat Rangitane (Tanenuiarangi) adalah masyarakat ...

Province of South Korea Province in Honam, South KoreaSouth Jeolla Province 전라남도ProvinceKorean transcription(s) • Hangul전라남도 • Hanja全羅南道 • McCune‑ReischauerChŏllanam-do • Revised RomanizationJeollanam-doFrom the left: Damyang, Yeosu, Mokpo, Yeongam, Haenam, Boseong FlagLogoCoordinates: 34°45′N 127°0′E / 34.750°N 127.000°E / 34.750; 127.000CountrySouth KoreaRegionHonamLargest ci...

 

 

Disambiguazione – Se stai cercando altri significati, vedi Eulero (disambigua). Disambiguazione – Euler rimanda qui. Se stai cercando altri significati, vedi Euler (disambigua). Leonhard Euler, dipinto di Jakob Emanuel Handmann Leonhard Euler (AFI: [ˈleːɔnhaʁt ˈɔʏlɐ] ascoltaⓘ), in italiano noto come Eulero (AFI: [euˈlɛro]) (Basilea, 15 aprile 1707 – San Pietroburgo, 18 settembre 1783) è stato un matematico, fisico e astronomo svizzero. È considerato il più import...

 

 

يفتقر محتوى هذه المقالة إلى الاستشهاد بمصادر. فضلاً، ساهم في تطوير هذه المقالة من خلال إضافة مصادر موثوق بها. أي معلومات غير موثقة يمكن التشكيك بها وإزالتها. (ديسمبر 2018) 108° خط طول 108 شرق خريطة لجميع الإحداثيات من جوجل خريطة لجميع الإحداثيات من بينغ تصدير جميع الإحداثيات من ك...

内華達州 美國联邦州State of Nevada 州旗州徽綽號:產銀之州、起戰之州地图中高亮部分为内華達州坐标:35°N-42°N, 114°W-120°W国家 美國建州前內華達领地加入聯邦1864年10月31日(第36个加入联邦)首府卡森城最大城市拉斯维加斯政府 • 州长(英语:List of Governors of {{{Name}}}]]) • 副州长(英语:List of lieutenant governors of {{{Name}}}]])喬·隆巴爾多(R斯塔...

 

 

KV52Tomba degli animaliIsometria, planimetria e alzato di KV52CiviltàAntico Egitto Utilizzotitolare sconosciuto EpocaNuovo Regno (XVIII dinastia) LocalizzazioneStato Egitto LocalitàLuxor DimensioniSuperficie4,3 m² Altezzamax 1,26 m Larghezzamax 1,37 m Lunghezzamax 4,5 m Volume4,3 m³ ScaviData scoperta1906 Date scavi1906 OrganizzazioneTheodore Davis ArcheologoEdward Russell Ayrton AmministrazionePatrimonioTebe (Valle dei Re) EnteMinistero delle Antichità Sito webwww.thebanmappin...

 

 

Северный морской котик Самец Научная классификация Домен:ЭукариотыЦарство:ЖивотныеПодцарство:ЭуметазоиБез ранга:Двусторонне-симметричныеБез ранга:ВторичноротыеТип:ХордовыеПодтип:ПозвоночныеИнфратип:ЧелюстноротыеНадкласс:ЧетвероногиеКлада:АмниотыКлада:Синапси...

These are a list of player and club records for Bradford City Association Football Club. Honours League Division One[1] Runners-up (1): 1998–99[2] Division Two[1] Winners (1): 1907–08 Play-off winners (1): 1995–96[3] Division Three[1] Winners (1): 1984–85 Division Three (North)[1] Winners (1): 1928–29 Division Four[1] Runners-up (1): 1981–82 Cup The Bradford City team which won the 1911 FA Cup FA Cup[1] Winners (1): ...

 

 

This article's tone or style may not reflect the encyclopedic tone used on Wikipedia. See Wikipedia's guide to writing better articles for suggestions. (May 2024) (Learn how and when to remove this message) British TV series or programme The ValleysGenreRealityCreated byMTVStarringSee belowCountry of originUnited KingdomOriginal languagesEnglish, WelshNo. of series4No. of episodes22 (list of episodes)ProductionExecutive producerFiona O'SullivanRunning time42 minutes(excluding adverts)Product...

 

 

此条目序言章节没有充分总结全文内容要点。 (2019年3月21日)请考虑扩充序言,清晰概述条目所有重點。请在条目的讨论页讨论此问题。 哈萨克斯坦總統哈薩克總統旗現任Қасым-Жомарт Кемелұлы Тоқаев卡瑟姆若马尔特·托卡耶夫自2019年3月20日在任任期7年首任努尔苏丹·纳扎尔巴耶夫设立1990年4月24日(哈薩克蘇維埃社會主義共和國總統) 哈萨克斯坦 哈萨克斯坦政府...

ديمقراطيةمعلومات عامةصنف فرعي من نظام سياسي جزء من أنظمة أفلاطون الخمس ممثلة بـ أنواع الديمقراطية لديه جزء أو أجزاء ديمقراطية مباشرةديمقراطية تمثيليةالهيئة الانتخابية النقيض أوتوقراطية تعديل - تعديل مصدري - تعديل ويكي بيانات جزء من سلسلة مقالات حولالديمقراطية تاريخ انت...

 

 

This is a list of common land in London, England. Most common land in England is registered for the purposes of the Commons Act 2006, but some commons are protected under separate local acts, such as Wimbledon and Putney Commons, which are protected under the Wimbledon and Putney Commons Act 1871. Registered land The following are common lands registered for the purposes of the Commons Act 2006.[1][2] Name Borough Area (hectares) Acton Green Ealing 5.9 Back Green Kingston upo...

 

 

هذه المقالة يتيمة إذ تصل إليها مقالات أخرى قليلة جدًا. فضلًا، ساعد بإضافة وصلة إليها في مقالات متعلقة بها. (نوفمبر 2018) موريل جورج معلومات شخصية الميلاد 29 أغسطس 1883   لندن  الوفاة 22 أكتوبر 1965 (82 سنة)   برايتون  مواطنة المملكة المتحدة المملكة المتحدة لبريطانيا العظمى و�...

Extinct language spoken by the Picts PictishRegionScotland, north of the Forth-Clyde lineEthnicityPictsErac. 4th to 10th century, extinct by c. 1100 ADLanguage familyIndo-European CelticInsular CelticBrittonicPictishWriting systemSome scattered instances of Ogham scriptLanguage codesISO 639-3xpiLinguist ListxpiGlottologpict1238 Pictish is an extinct Brittonic Celtic language spoken by the Picts, the people of eastern and northern Scotland from Late Antiquity to the Early Middle Ag...

 

 

Part of a series on thePriesthoodsof ancient RomeFlamen (AD 250–260) Major colleges Pontifices Augures Septemviri epulonum Quindecimviri sacris faciundis Other colleges or sodalities Fetiales Fratres Arvales Salii Titii Luperci Sodales Augustales Priests Pontifex Maximus Rex Sacrorum Flamen Dialis Flamen Martialis Flamen Quirinalis Rex Nemorensis Curio maximus Priestesses Virgo Vestalis Maxima Flaminica Dialis Regina sacrorum Related topics Religion in ancient Rome Imperial cult Glossary o...

 

 

Film website and YouTube channel This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) This article relies excessively on references to primary sources. Please improve this article by adding secondary or tertiary sources. Find sources: Collider website – news · newspapers · books · scholar · JSTOR (July 2018) (Learn how and when to remove this messa...

Colonial empire between 1492 and 1976 For the use of the imperial title in medieval Spain, see Imperator totius Hispaniae. Spanish EmpireImperio español (Spanish)1492–1976 Left: Cross of BurgundyRight: early modern flagMotto: Plus Ultra (Latin)Further BeyondAnthem: Marcha Real (Spanish)Royal MarchThe Spanish Empire during the second half of the 18th centuryCapitalItinerant court (1492–1561)Madrid (1561–1601, 1606–1976)Valladolid (1601–1606)Official lan...

 

 

Effort to avoid dealing with a stressor This article's lead section may be too short to adequately summarize the key points. Please consider expanding the lead to provide an accessible overview of all important aspects of the article. (January 2013) In psychology, avoidance coping is a coping mechanism and form of experiential avoidance. It is characterized by a person's efforts, conscious or unconscious, to avoid dealing with a stressor in order to protect oneself from the difficulties the s...