隠れマルコフモデル

隠れマルコフモデル(かくれマルコフモデル、: hidden Markov model; HMM)は、確率モデルのひとつであり、観測されない(隠れた)状態をもつマルコフ過程である。

概要

同じマルコフ過程でも、隠れマルコフモデルより単純なマルコフ連鎖では、状態は直接観測可能であり、そのため、状態の遷移確率のみがパラメータである。一方、隠れマルコフモデルにおいては、状態は直接観測されず、出力(事象)のみが観測される。ただしこの出力は、モデルの状態による確率分布である。従って、ある隠れマルコフモデルによって生成された出力の系列は、内部の状態の系列に関する何らかの情報を与えるものとなる。「隠れ」という語はモデルが遷移した状態系列が外部から直接観測されないことを指しており、モデルのパラメータについてのものではない。たとえパラメータが既知であっても隠れマルコフモデルと呼ばれる。隠れマルコフモデルはごく単純な動的ベイジアンネットワークとして表現することができる。

状態空間が離散の場合は離散型隠れマルコフモデル(discrete hidden Markov model)、連続の場合は連続分布型隠れマルコフモデル(continuous density hidden Markov model)と呼ばれ、連続と離散の混合型もある。

隠れマルコフモデルは、潜在変数(hidden variable, latent variable)が各々独立ではなく、マルコフ過程を通じて関連付けられている混合分布モデル(Mixture Model)を拡張したものとみなすことができる。この潜在変数は、それぞれの観測に対して選択されるように混合要素を制御するものである。近年、隠れマルコフモデルは、より複雑なデータ構造と非定常的なデータの取り扱いが可能なpairwise Markov modelsやtriplet Markov modelsに一般化されている。

隠れマルコフモデルに関する数学的概念はL. E. Baumと彼の同僚らによって1966年に発表された[1][2][3][4][5]。これは、最初にフォワードバックワードアルゴリズムを発表したR. L. Stratonovichによる非線形フィルタリング問題の最適化についての初期の成果に関連している。

隠れマルコフモデルは、音声認識バイオインフォマティクス形態素解析自然言語処理)、楽譜追跡、部分放電など、時系列パターンの認識に応用されている。連続的かつ伸縮しうる信号列のパターン抽出には適しているが、反面、長い距離をはさんで呼応しているような信号列からのパターン認識には、間の距離の長さに応じて状態数を増やす必要があり、計算量の観点から実用的ではない。また、局所最適に陥りやすいため、対象に応じて適切なパラメータの初期値を設定してやる(適切なモデルトポロジーを導入する)必要がある。

構成

図1. 隠れマルコフモデルの一般的な構成
図2. 隠れマルコフモデルのパラメータ(例)
: 潜在変数の状態
: 可能な観測値
: 状態遷移確率
: 出力確率

図1は、隠れマルコフモデルの一般的な構成を示している。確率変数 は、時刻 における潜在変数である。確率変数 は時刻 における観測値である。矢印は、条件付き確率間の依存関係を表している。

図2は潜在変数の状態数が3 ()、観測値の状態数が4()の隠れマルコフモデルを示している。

時刻 における潜在変数 の条件付き確率分布は、潜在変数 にのみ依存する。 およびそれ以前の状態は影響しない。これを(単純)マルコフ性という。また、観測値 にのみ依存する(時刻 が同じであることに注意)。ここで考えるような標準的な隠れマルコフモデルでは、潜在変数 は離散的であり、観測値 は連続的でも離散的でもよい。

隠れマルコフモデルのパラメータは、遷移確率出力確率の2種類である。遷移確率は、時刻 での潜在変数から時刻 での潜在変数への状態遷移を表す。図2において、遷移確率は で、出力確率は で示されている。

潜在変数の状態空間は 個の値をとる離散分布である(図2では)。これは、時刻 において潜在変数がとりうる 個の値のそれぞれに対して、時刻 での潜在変数がとりうる 個の値への遷移確率が存在することを意味する。結果的に、全体で の遷移確率がある(図2ではそのうちのみを示している)。この 行列をマルコフ行列という。確率の公理より、ある特定の状態から他の状態への遷移確率の和は1である。そのため、特定の状態からのある遷移確率はそれ以外の確率がわかれば決まるので、 個の遷移パラメータがあることになる。

これに加えて、個の状態のそれぞれに、潜在変数の特定の時刻において観測値の分布を支配する出力確率の組がある(図2ではで、の出力確率がある)。たとえば、観測値が離散分布で個の値をとるとき、個々の潜在変数に個のパラメータがあるから、全体で個の出力パラメータがある。あるいは、観測値が任意の混合ガウス分布に従う次元ベクトルであれば、平均値のために個と、共分散行列に個のパラメータがあるから、合わせての出力パラメータがある。

実際には、が小さくない限り、観測ベクトルの個々の要素間の共分散の特性に制約を設けることが現実的である。たとえば要素ごとに独立であるとか、もう少し制約を緩めて、隣接するいくつかの要素以外は独立であるなどとすることが考えられる。

推測

隠れマルコフモデルに関して、以下に示すようないくつかの統計的推測問題がある。

観測値系列の確率

図3. 隠れマルコフモデルの状態遷移と出力確率
点線の下にある出力系列が観測されたとき、これがどのような状態系列によって得られたものかを考えると、図に示された状態遷移と出力確率の矢印から、次の状態系列が候補となる。
5 3 2 5 3 2
4 3 2 5 3 2
3 1 2 5 3 2
それぞれの候補について、状態系列と観測系列の同時確率を求めることによって、最もありそうな(つまり最尤の)状態系列を求めることができる。一般にこのような最尤観測系列の問題はビタビアルゴリズムで効率的に解くことができる。

モデルのパラメータが既知のとき、特定の出力系列が得られる確率を求める。これは、可能な状態系列についての確率の総和によって得られる。

長さ の観測値系列

の確率は、潜在状態系列

の確率の総和を用いて次のように与えられる。

動的計画法の原理を適用すると、この問題は前向きアルゴリズムで効率的に扱うことができる。

潜在変数の確率

モデルパラメータと観測系列が与えられたとき、ひとつあるいはそれ以上の潜在変数の確率を求める以下のような問題がある。

フィルタリング

この問題は、モデルパラメータと観測系列が与えられたとき、系列の最後における潜在変数の状態の確率分布、つまり を求めるものである。この問題は、一般に、潜在変数の系列があるプロセスの背後の状態で、そのプロセスは各時刻の観測値に関してある過程が時刻の系列に従って遷移するものと考えられる場合に用いられる。従って、最後の時点でのプロセスの状態を知ることが自然である。この問題は、フォワードアルゴリズムで効率的に解くことができる。

平滑化

フィルタリングが系列の最後の状態を求めるのに対して、平滑化 (smoothing) は系列の途中のどこかの時点での潜在変数の確率分布、つまり ある時刻 における を求めるものである。これはフォワードバックワードアルゴリズムで効率的に解くことができる。

最尤系列推定

この問題は、前の2つの問題と異なり、特定の観測値系列を生成する潜在変数の系列全体の同時確率を求めるものである。これは一般に、隠れマルコフモデルをフィルタリングや平滑化とは異なる種類の問題に適用する場合に用いられる。

例えば自然言語処理構文解析における品詞タグ付けは、単語の並びから品詞を推定するものである。品詞を隠れマルコフモデルの潜在変数とし、ある品詞から他の品詞につながる確率を品詞付与コーパスなどから遷移確率として求めておく。また、各状態(品詞)から具体的な単語が出力されると考え、その出現確率もコーパスから求めておく。分析したい単語の並びが観測系列となる。品詞タグ付けは、与えられた単語列から隠れた状態としての品詞列を最尤推定するが、このとき関心があるのは全体の品詞の系列であり、フィルタリングや平滑化が扱うような単一の語の品詞を求めることではない。

この問題は、可能な状態系列の確率の最大値を求めるものであり、ビタビアルゴリズムによって効率的に解くことができる。

統計的有意性

上記のいくつかの問題に対して、統計的有意性を知りたい場合がある。帰無仮説が真となる分布から得られた系列が、どのような状態系列の確率をもつか(フォワードアルゴリズムの場合)あるいは状態系列の確率の最大値(ビタビアルゴリズムの場合)で少なくとも特定の出力系列と同じくらい大きなものは何かというようなものである。 隠れマルコフモデルで、特定の出力系列に関する仮説の統計的適切性を評価する場合、その統計的有意性は、出力系列に対して間違って仮説を棄却してしまう擬陽性率 (false positive rate) を示す。

具体例

図3. Graphical representation of the given HMM
図3. Graphical representation of the given HMM

遠くに住んでいる友人のアリスとボブがいて、電話で毎日お互い自分のしたことを話している。ボブは「公園での散歩 (walk)」、「買い物 (shop)」、「部屋の掃除 (clean)」の3つのことにしか関心がない。何をするかは、その日の天気によってのみ決めている。アリスはボブが住んでいる地域の日々の天気については具体的に知らないが、一般的な天候の変化については知っている。ボブが毎日話すことにもとづいて、アリスは天気がどのようになっているかを推測しようとする。

アリスは、天気が離散マルコフ過程として変化すると考える。天気には「雨 (Rainy)」と「晴れ (Sunny)」の2つの状態があるが、アリスはそれを直接知ることができないから「隠れ」た状態である。毎日、ボブは天気に応じて「散歩」「買い物」「掃除」のどれかひとつだけを必ずする。ボブがそれをアリスに話すことが、アリスにとっての観測(ボブからの出力)である。この状況全体が隠れマルコフモデルとなる。

アリスは、ボブのいる地域の一般的な天候の変化(遷移確率)については知っている。また、どの天気のときにボブがどの行動をするか(出力確率)を知っている。つまり隠れマルコフモデルのパラメータが既知である。これは、Pythonで次のように表される。

states = ('Rainy', 'Sunny')

observations = ('walk', 'shop', 'clean')

start_probability = {'Rainy': 0.6, 'Sunny': 0.4}

transition_probability = {
    'Rainy': {'Rainy': 0.7, 'Sunny': 0.3},
    'Sunny': {'Rainy': 0.4, 'Sunny': 0.6},
}

emission_probability = {
    'Rainy': {'walk': 0.1, 'shop': 0.4, 'clean': 0.5},
    'Sunny': {'walk': 0.6, 'shop': 0.3, 'clean': 0.1},
}

このコードでstart_probability は、ボブが最初に電話する前の時点で、隠れマルコフモデルがどちらの状態にあるかというアリスの考えである(彼女は平均的には雨の方がやや多いと知っている)。この確率分布は平衡なものではない(遷移確率によれば平衡は {'Rainy': 0.57, 'Sunny': 0.43})。遷移確率 transition_probability はマルコフ連鎖での天気の変化を表す。この例では、今日が雨であれば、明日晴れる確率は30%である。出力確率 emission_probability は、その日にボブが行う行動の確率である。もし雨であれば掃除をする確率は50%で、晴れていれば散歩に行く確率は60%である。

ビタビアルゴリズム

ビタビアルゴリズム(Viterbi algorithm)は、モデルパラメータが既知のとき、与えられた配列を出力した可能性(尤度)が最も高い状態列(最尤状態列)を計算するアルゴリズムで、動的計画法の一種である。ある時点 t での最尤状態遷移列はtまでに観測された情報と、t-1 までで最も確からしい(=尤もらしい)最尤状態遷移列だけに依存すると仮定する。

例えば、出力 'A' と 'B' を確率0.5ずつで出力し、他の状態にまれにしか遷移しない状態 A と、出力 'A' と 'C' を確率0.5ずつで出力し、他の状態にまれにしか遷移しない状態Bがあった場合、時点 t で 'A' が出力され、時点 t-1 で最尤だと推定された状態遷移列からの遷移確率が状態 A の方が高いならば、時点 t では状態 A にいたと推定される。しかし、t+1 以降で 'C' の出力が続いた場合、全体としての尤度は状態 B に遷移していたほうが高くなる。

ビタビアルゴリズムを使用するには、観測可能なイベントは観測不可能な状態遷移と1対1対応していることが求められる。

バウム・ウェルチアルゴリズム

バウム・ウェルチアルゴリズム(Baum-Welch algorithm)は、モデルが出力した系列からモデルパラメータを推定するアルゴリズムである。前向きアルゴリズム、後ろ向きアルゴリズム、EMアルゴリズムから構成される。前向きアルゴリズムおよび後ろ向きアルゴリズムは動的計画法の一種であり、ある時点で各状態にいる確率を求めるアルゴリズムである。

参照

  1. ^ Baum, L. E.; Petrie, T. (1966). “Statistical Inference for Probabilistic Functions of Finite State Markov Chains”. The Annals of Mathematical Statistics 37 (6): 1554–1563. doi:10.1214/aoms/1177699147. https://www.jstor.org/stable/2238772 2023年4月5日閲覧。. 
  2. ^ Baum, L. E.; Eagon, J. A. (1967). “An inequality with applications to statistical estimation for probabilistic functions of Markov processes and to a model for ecology”. Bulletin of the American Mathematical Society 73 (3): 360. doi:10.1090/S0002-9904-1967-11751-8. Zbl 0157.11101. http://projecteuclid.org/euclid.bams/1183528841. 
  3. ^ Baum, L. E.; Sell, G. R. (1968). “Growth transformations for functions on manifolds”. Pacific Journal of Mathematics 27 (2): 211–227. doi:10.2140/pjm.1968.27.211. https://www.scribd.com/doc/6369908/Growth-Functions-for-Transformations-on-Manifolds 28 November 2011閲覧。. 
  4. ^ Baum, L. E.; Petrie, T.; Soules, G.; Weiss, N. (1970). “A Maximization Technique Occurring in the Statistical Analysis of Probabilistic Functions of Markov Chains”. The Annals of Mathematical Statistics 41 (1): 164–171. doi:10.1214/aoms/1177697196. JSTOR 2239727. MR287613. Zbl 0188.49603. 
  5. ^ Baum, L.E. (1972). “An Inequality and Associated Maximization Technique in Statistical Estimation of Probabilistic Functions of a Markov Process”. Inequalities 3: 1–8. 

Read other articles:

Dante beralih ke halaman ini. Untuk kegunaan lain, lihat Dante (disambiguasi). Dante AlighieriPotret Dante Alighieri dengan medium tempera, karya Sandro Botticelli, 1495.Lahirc. 1265Firenze, Republik FirenzeMeninggal13/14 September 1321(usia c. 56 tahun)Ravenna, Negara GerejaPekerjaanNegarawan, penyair, teoretikus bahasa, teoretikus politikKebangsaanItaliaPeriodeAbad Pertengahan AkhirAliran sastraDolce Stil Novo Dante dan Beatrice di taman, 1903, karya bergaya pra-Raphaelite oleh Cesare ...

 

Yangon Airwayရန်ကုန် လေကြောင်းလိုင်း IATA ICAO Kode panggil YH[1] FSC HOTEL KILO Didirikan1996PenghubungBandar Udara Internasional YangonBandar Udara Mandalay ChanmyathaziProgram penumpang setiaElite Club[butuh rujukan]Armada2 Tujuan11 SloganYou're safe with usPerusahaan indukMyanma AirwaysKantor pusatYangon, MyanmarTokoh utamaKyaw Win (Managing Director)Situs webwww.yangonair.com Yangon Airways Ltd. adalah maskapai penerbangan yang ...

 

This is a list of astronauts, who are in a restricted sense, Asians. If Asian is restricted to refer to people from the continent of Asia, exclusive of Asian Russia and Turkey, who are not of predominantly European, African, or American ancestry, then the list is as follows: The first country listed is that of citizenship; the second, if any, is that of the Asian country of birth and/or ancestry, where different. Those of Asian ancestry but were born outside Asia are excluded. The table list...

Brand of canned and bottled coffee Suntory Boss Cafe au Lait Boss (ボス, Bosu) is a brand name of canned and plastic bottled coffee and coffee-flavored beverages sold by Suntory in Japan. History Boss was first released in 1992 and is one of many brands of Japanese canned coffee. Since 2006, American actor Tommy Lee Jones has appeared in a series of TV commercials and billboards for the brand,[1][2] becoming one of the most recognised faces in Japan.[3] The Suntory B...

 

1811-1813 meeting of U.S. legislature This article includes a list of general references, but it lacks sufficient corresponding inline citations. Please help to improve this article by introducing more precise citations. (February 2013) (Learn how and when to remove this message) 12th United States Congress11th ←→ 13thUnited States Capitol (1800)March 4, 1811 – March 4, 1813Members36 senators143 representatives5 non-voting delegatesSenate majorityDemocratic-RepublicanSenate Pr...

 

2012 film by AR Murugadoss ThuppakkiTheatrical release posterDirected byAR MurugadossWritten byAR MurugadossProduced byKalaipuli S. ThanuStarring Vijay Kajal Aggarwal CinematographySantosh SivanEdited byA. Sreekar PrasadMusic byHarris JayarajProductioncompanyV CreationsDistributed byGemini Film CircuitRelease date 13 November 2012 (2012-11-13) Running time170 minutes[1]CountryIndiaLanguageTamilBox office₹121 crore[2] Thuppakki (transl. Gun) is a 2012 Ind...

Les MesneuxcomuneLes Mesneux – Veduta LocalizzazioneStato Francia RegioneGrand Est Dipartimento Marna ArrondissementReims CantoneFismes-Montagne de Reims TerritorioCoordinate49°13′N 3°58′E / 49.216667°N 3.966667°E49.216667; 3.966667 (Les Mesneux)Coordinate: 49°13′N 3°58′E / 49.216667°N 3.966667°E49.216667; 3.966667 (Les Mesneux) Superficie4,27 km² Abitanti875[1] (2009) Densità204,92 ab./km² Altre informazioniCod. ...

 

Area VestinaPenne e il Gran Sasso Stati Italia Regioni Abruzzo Superficie634,23 km² Abitanti60 157[1] (31-12-2023) Densità94,85 ab./km² Fusi orariUTC+1 Nome abitantivestini L'area Vestina nella provincia di Pescara L'area Vestina è una zona geografica della provincia di Pescara che comprende molti comuni dell'entroterra pescarese a nord del fiume Pescara, e prende il nome dall'antico popolo italico dei Vestini che abitava la zona[2]. Molti...

 

  提示:此条目页的主题不是中華人民共和國最高領導人。 中华人民共和国 中华人民共和国政府与政治系列条目 执政党 中国共产党 党章、党旗党徽 主要负责人、领导核心 领导集体、民主集中制 意识形态、组织 以习近平同志为核心的党中央 两个维护、两个确立 全国代表大会 (二十大) 中央委员会 (二十届) 总书记:习近平 中央政治局 常务委员会 中央书记处 �...

Classic hits radio station in Pittsfield, Massachusetts WUPESimulcast of WUPE-FM, North AdamsPittsfield, MassachusettsBroadcast areaBerkshire MountainsFrequency1110 kHzBrandingWhoopeeProgrammingFormatClassic hitsAffiliationsCompass Media NetworksPremiere NetworksUnited Stations Radio NetworksOwnershipOwnerTownsquare Media(Townsquare License, LLC)Sister stationsWBEC, WBEC-FM, WNAW, WSBS, WUPE-FMHistoryFirst air dateSeptember 9, 1971; 52 years ago (1971-09-09) (as WGRG)Former ...

 

يفتقر محتوى هذه المقالة إلى الاستشهاد بمصادر. فضلاً، ساهم في تطوير هذه المقالة من خلال إضافة مصادر موثوق بها. أي معلومات غير موثقة يمكن التشكيك بها وإزالتها. (يوليو 2019) منتخب أرمينيا تحت 17 سنة لكرة القدم بلد الرياضة أرمينيا  الفئة كرة قدم تحت 17 سنة للرجال  [لغات أخرى]&#...

 

American mobster (1916–1977) Charles NicolettiBorn(1916-12-03)December 3, 1916Chicago, Illinois, U.S.DiedMarch 29, 1977(1977-03-29) (aged 60)Northlake, Illinois, U.S.Cause of deathMultiple gunshot woundsResting placeMount Carmel Cemetery (Hillside, Illinois)NationalityAmericanOther namesChuckie NicolettiChuckie the TypewriterOccupationMobsterAllegianceChicago Outfit Charles Nicoletti (/ˌnɪkəˈlɛti/; December 3, 1916 – March 29, 1977), also known as Chuckie the Typewrite...

Monarchs of theIberian Peninsula al-Andalus Almohads Almoravids Aragon (Family tree) Asturias Castile (Family tree) Catalonia Córdoba: Emirate, Caliphate Galicia Granada León Majorca Navarre (Family tree) Portugal (Family tree) Spain: Medieval, Modern (Family tree) Suebi Taifas Valencia Viguera Visigoths This is a list of the rulers of the Kingdom of Asturias, a kingdom in the Iberian peninsula during the Early Middle Ages. It originated as a refuge for Visigothic nobles following the conq...

 

Senate of Burundi Sénat du BurundiTypeTypeUpper house HistoryFounded1965[1]LeadershipPresidentEmmanuel Sinzohagera[2] since 25 August 2020 StructureSeats39 senatorsPolitical groups  CNDD-FDD: 34 seats   CNL: 1 seat   UPRONA: 1 seat   Twa: 3 seatsLength of term5 yearsElectionsVoting systemElectoral collegeMeeting placeGitegaWebsitewww.senat.bi Politics of Burundi Constitution Constitutional Court Human rights Constitution of the Kingdom ...

 

байдарки-одиночки, 500 метрів (жінки)на XXXII Олімпійських іграх Місце проведенняВеслувальний канал Сі ФорестДати4 серпня 2021 (попередні запливи і чвертьфінал)5 серпня 2021 (півфінал і фінал)Учасників13+ з 13+ країнПризери  Ліза Керрінгтон  Нова Зеландія Тамара ...

Disambiguazione – Peligno rimanda qui. Se stai cercando informazioni sull'antica lingua osco-umbra, vedi Dialetto peligno. La Sabina secondo l'Historical Atlas: i Peligni erano stanziati all'estremità orientale della regione, nella Valle Peligna I Peligni erano un piccolo popolo italico di lingua osco-umbra, storicamente stanziato nel I millennio a.C. nella Valle Peligna, parte dell'odierno Abruzzo. Entrati in conflitto con la Repubblica romana alla fine del IV secolo a.C., presto...

 

Badan PenyelenggaraJaminan Produk HalalKementerian AgamaRepublik IndonesiaLabel Halal Indonesia yang diluncurkan pada 2022.Informasi badanDibentuk11 Oktober 2017 (2017-10-11)Wilayah hukumIndonesiaKantor pusatJakarta, Indonesia6°17′26″S 106°53′11″E / 6.2905125°S 106.8863524°E / -6.2905125; 106.8863524Badan eksekutifMuhammad Aqil Irham, Kepala BadanM. Arfi Hatim, SekretarisMastuki, Kepala Pusat Registrasi dan Sertifikasi HalalH. A. Umar, Kepala Pusat Pem...

 

سفيرسك    علم شعار الإحداثيات 53°05′00″N 103°20′00″E / 53.083333333333°N 103.33333333333°E / 53.083333333333; 103.33333333333   تاريخ التأسيس 1735  تقسيم إداري  البلد روسيا[2][1]  خصائص جغرافية  المساحة 38.62 كيلومتر مربع  ارتفاع 410 متر  عدد السكان  عدد السكان 21186 (1959) ...

Sa'ar 5-class corvette of the Israeli Navy INS Hanit at Haifa port, May 2010 History Israel NameHanit NamesakeSpear BuilderNorthrop Grumman by Ingalls Shipbuilding Laid down5 April 1993 Launched5 March 1994 Commissioned7 February 1995 StatusActive Badge General characteristics Class and typeSa'ar 5-class corvette Displacement 1,275 tonnes (full load) 1,065 tonnes (standard) Length85.64 m (280.97 ft) Beam11.88 m (38.98 ft) Draft3.45 m (11.32 ft) Propulsion Combine...

 

First national park in South Africa Kruger National ParkPlains zebras in a Kruger landscapeLocation of the park (red area) in South AfricaLocationLimpopo and Mpumalanga provinces, South AfricaNearest cityMbombela (southern) Phalaborwa (central)Coordinates24°0′41″S 31°29′7″E / 24.01139°S 31.48528°E / -24.01139; 31.48528Area19,623 km2 (7,576 sq mi)[1][2][3]Established31 May 1926[4]Visitors1,659,793 (1,277,39...