Catena di Markov Monte Carlo

I metodi Monte Carlo basati su Catena di Markov (MCMC) sono una classe di algoritmi per il campionamento da distribuzioni di probabilità basata sulla costruzione di una catena di Markov avente come distribuzione di equilibrio (o stazionaria) la distribuzione desiderata. Dopo aver simulato un grande numero di passi della catena si può quindi usare i valori estratti come campione della distribuzione desiderata.

Solitamente non è difficile costruire una catena di Markov con le proprietà desiderate, ma non è sempre possibile determinare a priori quanti passi sono necessari per convergere con un errore accettabile alla distribuzione stazionaria[1]. Una MCMC è tanto migliore quanto minore è il suo tempo di mixing, ossia di convergenza alla distribuzione stazionaria, partendo da una posizione arbitraria[2].

Storia e applicazioni

L'applicazione tipica di questi metodi può essere descritta come il campionamento da una distribuzione di probabilità multidimensionale di cui si conosce solamente una funzione proporzionale alla funzione di densità di probabilità. Qualora si avesse una funzione a valori positivi, un metodo MCMC può essere quindi utilizzato per stimarne l'integrale, e risulta più efficiente di un metodo Monte Carlo semplice nel caso di problemi in molte dimensioni. In questo contesto è nato il l'algoritmo di Metropolis, primo esempio di Catena di Markov Monte Carlo, proposto nel 1953 dall'equipe di Nicholas Metropolis, che lavorava al programma atomico americano e responsabili tra l'altro dello sviluppo dei primi metodi Monte Carlo[3].

L'algoritmo di Metropolis consiste in una passeggiata aleatoria (random walk) con una correzione per cui ogni nuovo valore estratto può essere rigettato se corrisponde a un valore della funzione integranda minore rispetto al punto precedente, con una probabilità uguale a uno meno il rapporto tra questi valori. Questo fa sì che il processo aleatorio si concentri nelle zone dove l'integrando ha valori più alti, da qui l'efficacia. All'opposto che nei metodi Monte Carlo semplici, però, dove i valori campionati sono statisticamente indipendenti, nell'algoritmo di Metropolis (e nelle catene di Markov Monte Carlo in generale) sono autocorrelati.

Nel 1970 Hastings pubblicò una generalizzazione dell'algoritmo di Metropolis (che guadagnò il nome di algoritmo di Metropolis-Hastings) che utilizza un processo aleatorio di base (proposal distribution) non necessariamente di tipo random walk. Un particolare caso dell'algoritmo di Metropolis-Hastings è il campionamento di Gibbs, nominato così in onore del fisico Willard Gibbs, e divenuto famoso nella comunità statistica negli anni '90 grazie alla sua validità come strumento per campionare dalle distribuzioni a posteriori nel campo della statistica bayesiana[3].

Integrali multidimensionali spesso si presentano in statistica bayesiana, fisica computazionale, biologia computazionale e linguistica computazionale, e in tal modo i metodi MCMC sono ampiamente utilizzati in questi campi[4][5].

Problematiche relative alle MCMC

Le catene di Markov Monte Carlo sono costruite per concentrare il maggior possibile sforzo computazionale nelle zone di massima densità di probabilità bersaglio, ma siccome queste zone non sono conosciute in anticipo, le prime osservazioni della catena si troveranno necessariamente nelle vicinanze del punto iniziale, scelto arbitrariamente, in zone di densità solo relativamente maggiori a quella iniziale. Per questa ragione il campione finale sarebbe anche pesantemente distorto dalle osservazioni iniziali, che devono quindi essere scartate ai fini dalle stime. La parte iniziale della catena, da scartare, viene chiamata di burn-in o warm-up (riscaldamento) per analogia.

Nonostante questo accorgimento, da un punto di vista stocastico sussiste sempre qualche effetto residuo dipendente dalla scelta della posizione di partenza. Questo effetto è nella pratica spesso trascurabile, ma teoricamente il campionamento MCMC tipico può solo approssimare la distribuzione bersaglio. Algoritmi basati su campionamenti MCMC più sofisticati come il cosiddetto "accoppiamento dal passato" (coupling from the past) possono produrre campioni esatti, seppure al prezzo di una maggiore complessità di elaborazione numerica e di un tempo di esecuzione indefinito (di valore atteso finito, ma sconosciuto prima dell'esecuzione).

Al crescere del numero di dimensioni del problema, anche gli algoritmi MCMC soffrono la maledizione della dimensionalità: le regioni di maggior densità tendono ad allungarsi e distanziarsi, all'interno di uno spazio di sempre maggior volume. Algoritmi più avanzati, come l'HMC, sono più adatti a questo genere di problemi perché, al costo di una maggior complessità e costo computazionale, riescono a concentrare più efficacemente i valori estratti all'interno della zona di maggior densità, senza rinunciare a distanziare i valori campionati tra loro (e quindi mantenendo bassa l'autocorrelazione).

Nonostante questo, le catene di Markov Monte Carlo potrebbero esibire problemi di convergenza nel caso di distribuzioni obbiettivo particolarmente complesse, oppure che violano le condizioni stesse di ergodicità del processo adottato. Per rilevare questo problema è bene simulare diverse catene con punti di partenza distanti tra loro e in seguito controllare che risultino nella stessa distribuzione, ma la soluzione richiede un algoritmo adeguato. La maggior parte degli algoritmi MCMC prevede dei parametri che necessitano di essere specificati, e il valore che gli viene attribuito deve essere adatto al problema affrontato, in modo da ottenere una bassa variabilità per le stime basate sul campione Monte Carlo.

Lista di algoritmi

  • algoritmo di Metropolis-Hastings.
  • campionamento di Gibbs: Richiede che tutte le distribuzioni condizionate della distribuzione bersaglio siano conosciute propriamente e possano essere usate per campionarvi. Questo metodo è divenuto popolare in quanto, nel caso in cui sia possibile applicarlo, esso non richiede che si prestabilisca alcun parametro relativo all'algoritmo.
  • campionamento per "strati" ("slices"): Dipende sul principio che è possibile campionare uniformemente una distribuzione dalla regione sottesa dalla curva della sua funzione di densità. Questo metodo alterna un campionamento uniforme nella direzione verticale con uno dallo "strato" individuato dalla posizione verticale corrente.
  • Metropolis a tentativi multipli (''Multiple-try Metropolis''): È una variante dell'algoritmo di Metropolis-Hastings che permette tentativi multipli a ogni punto. Questo permette all'algoritmo di impostare passi più grandi in forma sistematica consentendo in tal modo di affrontare problemi aventi dimensionalità intrinsecamente ampie.
  • metodo del sovra-rilassamento: Una versione Monte Carlo di questa tecnica può essere vista come una variazione del campionamento di Gibbs (Gibbs sampling); esso qualche volta evita ripetizioni del percorso.
  • metodo di Monte Carlo ibrido (Hybrid/Hamiltonian Monte Carlo, HMC): Implementa dinamiche hamiltoniane nella catena di Markov aumentando lo spazio indagato con uno spazio ausiliario dei momenti. La densità bersaglio quindi diventa la funzione di energia potenziale e il momento viene via via sorteggiato da una distribuzione prestabilita condizionata al punto xi , a quel punto viene calcolata una traiettoria di energia costante che viene fermata dopo una quantità di tempo arbitrario. Alla fine del campionamento i dati sui momenti vengono scartati. Il risultato finale è di allungare i passi proposti mantenendoli però all'interno delle regioni di alta densità.
  • No U-Turn Sampling (NUTS): Variante del metodo HMC che evita ulteriormente ripetizioni da parte della catena, calcolando in maniera adattiva il tempo delle traiettorie.
  • Il metodo MCMC di Langevin ed altri metodi basati sul metodo del gradiente (eventualmente in derivata seconda) del logaritmo della distribuzione obbiettivo, propongono percorsi che sono preferibilmente nella direzione di più alta densità di probabilità.[6]

Metodi basati sul cambiamento di dimensione

Il metodo reversible-jump è una variante del metodo di Metropolis-Hastings che permette la proposta di passi che cambiano la dimensionalità dello spazio parametrico su cui opera la passeggiata aleatoria. Questo metodo fu proposto nel 1995 dallo statistico Peter Green dell'Università di Bristol.[7] Metodi MCMC che cambiano dimensionalità sono stati a lungo usati in applicazioni di fisica statistica, dove venivano usati per i vari problemi distribuzioni basate sull'insieme gran canonico (ad esempio quando il numero di molecole in una scatola è variabile). Qualche variante di sorta del metodo reversible-jump è richiesta nel caso di campionamenti MCMC o di Gibbs sopra modelli bayesiani non parametrici come quelli implicati nel processo di Dirichlet[8] (un processo stocastico che può essere pensato come una distribuzione di probabilità il cui dominio è esso stesso una distribuzione casuale) o quello del Chinese restaurant process, dove il numero di componenti, cluster, ecc. è automaticamente dedotto dai dati.

Note

  1. ^ (EN) Andrew Gelman e Donald B. Rubin, Inference from Iterative Simulation Using Multiple Sequences, in Statistical Science, vol. 7, n. 4, 1992-11, pp. 457–472, DOI:10.1214/ss/1177011136. URL consultato il 4 dicembre 2018.
  2. ^ (EN) David Asher Levin e Elizabeth L. Wilmer, Markov chains and mixing times, American Mathematical Society, 2009, ISBN 9780821847398, OCLC 234257270. URL consultato il 4 dicembre 2018.
  3. ^ a b (EN) George Casella e Christian Robert, A Short History of Markov Chain Monte Carlo: Subjective Recollections from Incomplete Data, in Statistical Science, vol. 26, n. 1, 2011-02, pp. 102–115, DOI:10.1214/10-STS351. URL consultato il 27 dicembre 2018.
  4. ^ Jeff Gill, Bayesian methods: a social and behavioral sciences approach, Second Edition, London, Chapman and Hall/CRC, 2008, ISBN 1-58488-562-9.
  5. ^ Christian P Robert & Casella G, Monte Carlo statistical methods, Second Edition, New York, Springer, 2004, ISBN 0-387-21239-6.
  6. ^ Stramer, O., & Tweedie, R. (1999). Langevin-Type Models II: Self-Targeting Candidates for MCMC Algorithms*. Methodology and Computing in Applied Probability. 1 (3), 307–328.
  7. ^ P. J. Green. Reversible-jump Markov chain Monte Carlo computation and Bayesian model determination. Biometrika, 82(4):711–732, 1995
  8. ^ Copia archiviata (PDF), su dm.unipi.it. URL consultato il 4 giugno 2012 (archiviato dall'url originale il 4 marzo 2016).

Bibliografia

  • Christophe Andrieu et al., "An Introduction to MCMC for Machine Learning", 2003
  • Bernd A. Berg. "Markov Chain Monte Carlo Simulations and Their Statistical Analysis". Singapore, World Scientific 2004.
  • George Casella and Edward I. George. "Explaining the Gibbs sampler". The American Statistician, 46:167–174, 1992. (Un riassunto introduttivo al metodi di campionamento di Gibbs, con esempi e riferimenti bibliografici.)
  • A.E. Gelfand and A.F.M. Smith. "Sampling-Based Approaches to Calculating Marginal Densities". J. American Statistical Association, 85:398–409, 1990.
  • Andrew Gelman, John B. Carlin, Hal S. Stern, and Donald B. Rubin. Bayesian Data Analysis. London: Chapman and Hall. First edition, 1995. (Capitolo 11.)
  • S. Geman and D. Geman. "Stochastic Relaxation, Gibbs Distributions, and the Bayesian Restoration of Images". IEEE Transactions on Pattern Analysis and Machine Intelligence, 6:721–741, 1984.
  • Radford M. Neal, Probabilistic Inference Using Markov Chain Monte Carlo Methods, 1993.
  • Gilks W.R., Richardson S. and Spiegelhalter D.J. "Markov Chain Monte Carlo in Practice". Chapman & Hall/CRC, 1996.
  • C.P. Robert and G. Casella. "Monte Carlo Statistical Methods" (seconda edizione). New York: Springer-Verlag, 2004.
  • R. Y. Rubinstein and D. P. Kroese. Simulation and the Monte Carlo Method (seconda edizione). New York: John Wiley & Sons, 2007. ISBN 978-0-470-17794-5
  • R. L. Smith "Efficient Monte Carlo Procedures for Generating Points Uniformly Distributed Over Bounded Regions", Operations Research, Vol. 32, pp. 1296–1308, 1984.
  • Asmussen and Glynn "Stochastic Simulation: Algorithms and Analysis", Springer. Series: Stochastic Modelling and Applied Probability, Vol. 57, 2007.
  • P. Atzberger, "An Introduction to Monte-Carlo Methods." [1].
  • Bolstad, William M. (2010) Understanding Computational Bayesian Statistics, John Wiley.

Ulteriori letture

Voci correlate

Collegamenti esterni

Read other articles:

Zenas R. BlissMayjen Zenas R. BlissLahir(1835-04-17)17 April 1835Johnston, Rhode IslandMeninggal2 Januari 1900(1900-01-02) (umur 64)Washington, D.C.Tempat pemakamanArlington National CemeteryPengabdianAmerika SerikatUnionDinas/cabangAngkatan Darat Amerika SerikatUnion ArmyLama dinas1854–1897Pangkat Mayor JenderalKomandan10th Regiment Rhode Island Volunteer Infantry 7th Regiment Rhode Island Volunteer Infantry1st Brigade, 2nd Division, IX Corps 24th U.S. InfantryDepartment of Texas...

 

هذه المقالة يتيمة إذ تصل إليها مقالات أخرى قليلة جدًا. فضلًا، ساعد بإضافة وصلة إليها في مقالات متعلقة بها. (فبراير 2023) في إيطاليا، تتم ملاحظة آثار تغير المناخ على نطاق واسع. ومع زيادة الأحداث المتطرفة مثل موجات الحر والجفاف والفيضانات المتكررة،[1] فإن إيطاليا تواجه العد�...

 

Pok Pia Pok Pia Goreng Pok pia (Hanzi: 薄餅, hanyu pinyin: bao bing) adalah sejenis kue tipis dari tepung terigu yang digoreng. Bentuk pok pia berbeda-beda di masing-masing daerah. Pok pia biasanya berasa manis, namun juga ada yang berasa asin sesuai dengan cara mencicipi. Pok pia adalah penamaan dalam bahasa Hokkien karena penganan ini umum di kalangan masyarakat Tionghoa di Asia Tenggara. Sejarah Menurut Reay Tanahil, penulis buku Food in History, pok pia pertama kali dibuat dan mulai dim...

Fictional character from Breaking Bad and Better Call Saul Ehrmantraut redirects here. For the German football defender, see Horst Ehrmantraut. For the surname, see Ermentraut. Fictional character Mike EhrmantrautBreaking Bad characterJonathan Banks as Mike Ehrmantraut in a promotional poster for Better Call Saul's third seasonFirst appearance Breaking Bad: ABQ (2009) Better Call Saul: Uno (2015) Last appearance Breaking Bad: El Camino (2019) Better Call Saul: Saul Gone (2022) Created byV...

 

كارل هيس معلومات شخصية الميلاد 20 يونيو 1945 (79 سنة)  تروماو  مواطنة النمسا الولايات المتحدة  عضو في الأكاديمية الوطنية للعلوم،  والأكاديمية الأمريكية للفنون والعلوم  الحياة العملية المدرسة الأم جامعة فيينا  شهادة جامعية دكتوراه  المهنة فيزيائي،  وأستاذ ...

 

Soviet unmanned Progress cargo spacecraft Progress 20A Progress 7K-TG spacecraftMission typeSalyut 7 resupplyCOSPAR ID1984-038A SATCAT no.14932[1] Spacecraft propertiesSpacecraftProgress (No.121)Spacecraft typeProgress 7K-TG[2]ManufacturerNPO Energia Start of missionLaunch date15 April 1984, 08:12:53 UTC[1]RocketSoyuz-U2[2]Launch siteBaikonur, Site 31/6 End of missionDisposalDeorbitedDecay date7 May 1984, 00:32:51 UTC[3] Orbital parametersReference ...

Франц Саксен-Кобург-Заальфельдскийнем. Franz von Sachsen-Coburg-Saalfeld герцог Саксен-Кобург-Заальфельдский 8 сентября 1800 — 9 декабря 1806 Предшественник Эрнст Фридрих Саксен-Кобург-Заальфельдский Преемник Эрнст I Саксен-Кобург-Заальфельдский Рождение 15 июля 1750(1750-07-15)Кобург, Сакс...

 

此條目可参照英語維基百科相應條目来扩充。 (2021年5月6日)若您熟悉来源语言和主题,请协助参考外语维基百科扩充条目。请勿直接提交机械翻译,也不要翻译不可靠、低品质内容。依版权协议,译文需在编辑摘要注明来源,或于讨论页顶部标记{{Translated page}}标签。 约翰斯顿环礁Kalama Atoll 美國本土外小島嶼 Johnston Atoll 旗幟颂歌:《星條旗》The Star-Spangled Banner約翰斯頓環礁�...

 

طواف نيوشبلاد 2022 تفاصيل السباقسلسلة77. طواف نيوشبلادمنافسةطواف العالم للدراجات 2022 1.UWT‏التاريخ26 فبراير 2022المسافات204٫2 كمالبلد بلجيكانقطة البدايةخنتنقطة النهايةNinove [الإنجليزية]‏الفرق25عدد المتسابقين في البداية171عدد المتسابقين في النهاية124متوسط السرعة42٫185 كم/سالا�...

Частина серії проФілософіяLeft to right: Plato, Kant, Nietzsche, Buddha, Confucius, AverroesПлатонКантНіцшеБуддаКонфуційАверроес Філософи Епістемологи Естетики Етики Логіки Метафізики Соціально-політичні філософи Традиції Аналітична Арістотелівська Африканська Близькосхідна іранська Буддій�...

 

يفتقر محتوى هذه المقالة إلى الاستشهاد بمصادر. فضلاً، ساهم في تطوير هذه المقالة من خلال إضافة مصادر موثوق بها. أي معلومات غير موثقة يمكن التشكيك بها وإزالتها. (ديسمبر 2018) مركز مغيراء مركز مغيراء (سكاكا)علم مركز مغيراء (سكاكا)شعار تقسيم إداري البلد  السعودية المنطقة الجوف ا�...

 

  لمعانٍ أخرى، طالع محرك بحث (توضيح). محرك البحث (بالإنجليزية: Search Engine)‏ هو نظام لاسترجاع المعلومات صمم للمساعدة على البحث عن المعلومات المخزنة على أي نظام حاسوبي.[1] تعرض نتائج البحث عادة على شكل قائمة لأماكن تواجد المعلومات ومرتبة وفق معايير معينة. تسمح محركات الب...

Ahmad bin Muhammad bin Hanbal bin Hilal bin Asad bin Idris bin 'Abdillah bin Hayyan bin 'Abdillah bin Anas bin 'Auf bin Qasith bin Mazin bin Syaiban bin Dzuhl bin Tsa'labah bin Ukanah bin Sha'b bin 'Ali bin Bakr bin Wa'il bin Qasith bin Hanab bin 'Aqsha bin Da'mi bin Jadilah bin Asad bin Rabi'ah bin Nizar bin Ma'd bin AdnanNamaAhmad bin Muhammad bin Hanbal bin Hilal bin Asad bin Idris bin 'Abdillah bin Hayyan bin 'Abdillah bin Anas bin 'Auf bin Qasith bin Mazin bin Syaiban bin Dzuhl bin Tsa'l...

 

English footballer Ryan Woods Woods playing for Brentford in 2015Personal informationFull name Ryan Michael Woods[1]Date of birth (1993-12-13) 13 December 1993 (age 30)[2]Place of birth Norton Canes, EnglandHeight 5 ft 8 in (1.73 m)[2]Position(s) Defensive midfielderTeam informationCurrent team Hull CityYouth career0000–2009 Walsall2009–2012 Shrewsbury TownSenior career*Years Team Apps (Gls)2012–2015 Shrewsbury Town 91 (1)2015–2019 Brentford...

 

Japanese manga series You can help expand this article with text translated from the corresponding article in Japanese. (July 2023) Click [show] for important translation instructions. View a machine-translated version of the Japanese article. Machine translation, like DeepL or Google Translate, is a useful starting point for translations, but translators must revise errors as necessary and confirm that the translation is accurate, rather than simply copy-pasting machine-translated text ...

American television executive Dick EbersolBornDuncan Ebersol (1947-07-28) July 28, 1947 (age 76)Torrington, Connecticut, U.S.OccupationAmerican television executive NBCSpouses Susan Stafford ​ ​(m. 1976; ann. 1981)​ Susan Saint James ​(m. 1981)​ Children3, including Charlie Duncan Dick Ebersol[1] (/ˈɛbərsɒl/; born July 28, 1947) is an American television executive and a senior adviser for NBC Univers...

 

Religion in Singapore (2020)[1][2][3]   Buddhism (31.05%)  No Religion (20.02%)  Christianity (18.92%)  Islam (15.59%)  Hinduism (5.0%)  Sikhism (0.35%)  Taoism, Other Chinese (8.79%)  Other Religions (0.28%) Part of a series on theCulture of Singapore History Singaporeans Immigration Holidays Languages Multiculturalism Symbols Women Topics Architecture Art Cinema Cuisine Festivals Hawker ...

 

Major smallpox epidemic that afflicted much of Japan 735–737 Japanese smallpox epidemicDiseaseSmallpoxLocationJapanDates735–737 CEDeaths1 million The 735–737 Japanese smallpox epidemic (天平の疫病大流行, Tenpyō no ekibyō dairyūkō, Epidemic of the Tenpyō era) was a major smallpox epidemic that afflicted much of Japan. Killing approximately one third (around 1 million individuals) of the entire Japanese population, the epidemic had significant social, economic, and religious ...

هذه المقالة يتيمة إذ تصل إليها مقالات أخرى قليلة جدًا. فضلًا، ساعد بإضافة وصلة إليها في مقالات متعلقة بها. (أبريل 2019) تروي غريغوري   معلومات شخصية الميلاد 13 نوفمبر 1966 (58 سنة)[1]  ديترويت  مواطنة الولايات المتحدة  الحياة العملية المهنة مغن مؤلف،  وممثل  اللغة...

 

Ymare La mairie. Administration Pays France Région Normandie Département Seine-Maritime Arrondissement Rouen Intercommunalité Métropole Rouen Normandie Maire Mandat Ingrid Bona 2020-2026 Code postal 76520 Code commune 76753 Démographie Gentilé Ymarois Populationmunicipale 1 212 hab. (2021 ) Densité 301 hab./km2 Géographie Coordonnées 49° 20′ 59″ nord, 1° 10′ 35″ est Altitude Min. 47 mMax. 153 m Superficie 4,03 km2...