Структурное прогнозирование

Структурное прогнозирование, или структурное обучениесобирательный термин для техник машинного обучения с учителем, вовлекающих предвидение структурных объектов, а не скалярных дискретных или вещественных значений[1].

Аналогично широко используемым техникам обучения с учителем, модели структурного прогнозирования обычно обучаются с помощью наблюдаемых данных, где истинное предсказанное значение используется для пересмотра параметров модели. Из-за возможной сложности модели и взаимосвязи предсказанных переменных, процесс предсказания с использованием обучения модели часто вычислительно невыполним, вследствие этого используются приближённые выводы[англ.].

Для оценки структурного коэффициента применяется косвенный МНК.

Приложения

Например, задачу перевода предложения естественного языка в синтаксическое представление, такое как дерево синтаксического разбора[англ.], можно рассматривать как задачу структурного прогнозирования [2], в которой структурная область вывода является множеством всех возможных деревьев разбора. Структурное прогнозирование также используется в широкой области приложений, включая биоинформатику, обработку естественного языка, распознавание речи и компьютерное зрение.

Пример: разметка последовательностей

Разметка последовательностей — это класс задач, широко распространённых в обработке естественного языка, где входными данными часто являются последовательности (например, предложения в тексте). В некоторых версиях возникает необходимость разметки последовательностей, например в разметке частей речи и распознавании именованных сущностей[англ.]. В частеречной разметке, например, каждое слово в последовательности должно получить «ярлык» (класс метки), который выражает «тип» слова:

This ДТ
is ГЛ
a ДТ
tagged ИП
sentence ИС
. .

Основной целью этой задачи является правильное определение понятия (элемента последовательности) при наличии нескольких подходящих для него значений: существительное "sentence" ( рус. «предложение») в английском языке может быть также глаголом; чтобы облегчить определение части речи слову можно присвоить соответствующий «ярлык».

На первый взгляд, описанная выше задача может быть решена посредством простой классификации индивидуальных элементов, однако этот подход не учитывает эмпирический факт: ярлыки не возникают независимо. Наоборот, каждый ярлык показывает сильную условную зависимость[англ.] от ярлыка предыдущих слов. То есть от того, какая метка стоит, например, у слова "sentence" — глагол или прилагательное — зависят метки других слов в предложении. Этот факт может быть использован в моделях, которые предсказывают всю последовательность ярлыков для предложения, таких как скрытая марковская модель или условное случайное поле[англ.][2]. Для моделей, использующих индивидуальные ярлыки, например алгоритм Витерби, такой способ не подходит.

Техники

Графовые вероятностные модели образуют большой класс моделей структурного прогнозирования. В частности, популярны байесовские сети и случайные поля[англ.]. Другие алгоритмы и модели для структурного прогнозирования включают индуктивное логическое программирование, рассуждения на основе прецедентов, структурные методы опорных векторов[англ.], логико-марковские сети[англ.] и ограниченные условные модели[англ.]. Основные техники:

Структурный перцептрон

Один из самых простых путей понять алгоритмы общего структурного прогнозирования — структурный перцептрон Коллинза[3]. Этот алгоритм комбинирует алгоритм перцептрона для обучения линейных классификаторов с алгоритмом логического вывода (классически, алгоритмом Витерби, если используется для последовательных данных) и может быть описан абстрактно следующим образом:

Определяем «совместную функцию признаков» Φ(x, y), которая отображает тренировочный элемент x и предсказанного кандидата y в вектор длины n. При этом x и y могут иметь любую структуру, а значение n зависит от задачи, но фиксировано для каждой модели. Пусть GEN будет функцией, которая генерирует кандидата в предсказатели. Тогда:

Пусть будет вектором весов длины n
Для предопределённого числа итераций:
Для каждого экземпляра в тренировочном наборе с истинным выводом :
Делаем предсказание
Обновляем , от к : , является темпом обучения.

На практике, нахождение Argmax на может быть осуществлено с помощью алгоритма, такого как алгоритм Витерби или алгоритм max-sum, а не полного перебора по экспоненциально большому множеству кандидатов.

Идея обучения похожа на перцептрон с множеством классов.

Примечания

Литература

  • Gökhan BakIr, Ben Taskar, Thomas Hofmann, Bernhard Schölkopf, Alex Smola, S.V.N. Vishwanathan. Predicting Structured Data. — MIT Press, 2007.
  • Lafferty J., McCallum A., Pereira F. Conditional random fields: Probabilistic models for segmenting and labeling sequence data // Proc. 18th International Conf. on Machine Learning. — 2001. Архивная копия от 7 июня 2013 на Wayback Machine
  • Michael Collins. Discriminative training methods for hidden Markov models: Theory and experiments with perceptron algorithms // Proc. EMNLP. — 2002. — Т. 10. Архивная копия от 8 декабря 2006 на Wayback Machine
  • Noah Smith, Linguistic Structure Prediction, 2011.

Ссылки

Read other articles:

Pembuang panas dalam bentuk kipas di dalam komputer Pembuang panas (bahasa Inggris: heat sink) adalah penukar panas pasif yang memindahkan panas yang dihasilkan oleh alat elektronik atau mekanik ke sebuah medium fluida yang sering kali berupa pendingin udara atau cair, dan lalu panas akan dikeluarkan dari alatnya dan suhu alat akan tetap terjaga pada suhu yang optimal. Pembuang panas digunakan di dalam komputer untuk mendinginkan unit pemroses sentral atau pemroses grafis. Alat ini diranc...

 

Cet article est une ébauche concernant la Corée. Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants. JumongFonctionRoiTitre de noblesseRoiBiographieNaissance 58 av. J.-C.PuyŏDécès 19 av. J.-C.Sépulture PyongyangNom dans la langue maternelle 동명성왕 ou 동명왕Père Hae Mo-su (en)Mère Madame Yuhwa (en)Conjoints So Seo-no (en)Madame Ye (en)Enfants Biryu (en)Yuri de GoguryeoOnjo de Baekjemodifier - modifie...

 

Indian politician and economist (1898–1998) Gulzarilal NandaInterim Prime Minister of IndiaIn office11 January 1966 – 24 January 1966PresidentSarvepalli RadhakrishnanVice PresidentZakir HusainPreceded byLal Bahadur ShastriSucceeded byIndira GandhiIn office27 May 1964 – 9 June 1964PresidentSarvepalli RadhakrishnanVice PresidentZakir HussainPreceded byJawaharlal NehruSucceeded byLal Bahadur ShastriMinister of Home AffairsIn office29 August 1963 – 14 Novemb...

Untuk klub sepak bola dengan nama yang sama, lihat Sheffield United F.C. dan Sheffield Wednesday F.C. Sheffield F.C.Nama lengkapSheffield Football ClubBerdiri24 Oktober 1857; 166 tahun lalu (1857-10-24)StadionCoach and Horses Ground, Dronfield(Kapasitas: 2,000)KetuaRichard Tims[1]ManajerCurtis WoodhouseLigaLiga Utara InggrisDivisi Satu Selatan2011–12Liga Utara InggrisDivisi Satu Selatan, ke-4Situs webSitus web resmi klub Kostum kandang Kostum tandang Musim ini Sheffield FC...

 

Bencana Molase BostonAkibat bencana; foto oleh Globe Newspaper Co. (Boston Public Library)Tanggal15 Januari 1919LokasiBoston, MassachusettsKoordinat42°22′06.6″N 71°03′21.0″W / 42.368500°N 71.055833°W / 42.368500; -71.055833Koordinat: 42°22′06.6″N 71°03′21.0″W / 42.368500°N 71.055833°W / 42.368500; -71.055833PenyebabKegagalan tegangan silinderKorban21 tewas150 terluka Bencana Molase Boston, juga dikenal sebagai Banjir Mola...

 

Untuk kegunaan lain, lihat Sorong (disambiguasi). Kabupaten Sorong SelatanKabupatenPemandangan Kali Sembra LambangJulukan: Caribbean van PapuaMotto: Mbilin KayamPetaKabupaten Sorong SelatanPetaTampilkan peta Maluku dan PapuaKabupaten Sorong SelatanKabupaten Sorong Selatan (Indonesia)Tampilkan peta IndonesiaKoordinat: 1°30′18″S 132°17′11″E / 1.50495°S 132.28638°E / -1.50495; 132.28638Negara IndonesiaProvinsiPapua Barat DayaTanggal berdiri12 Ap...

2017 American filmMarshallTheatrical release posterDirected byReginald HudlinWritten by Michael Koskoff Jacob Koskoff Produced by Paula Wagner Reginald Hudlin Jonathan Sanger Starring Chadwick Boseman Josh Gad Kate Hudson Dan Stevens Sterling K. Brown James Cromwell CinematographyNewton Thomas SigelEdited byTom McArdleMusic byMarcus MillerProductioncompanies Starlight Media Chestnut Ridge Productions Hudlin Entertainment Distributed byOpen Road FilmsRelease dates September 20, 2017&...

 

МифологияРитуально-мифологическийкомплекс Система ценностей Сакральное Миф Мономиф Теория основного мифа Ритуал Обряд Праздник Жречество Мифологическое сознание Магическое мышление Низшая мифология Модель мира Цикличность Сотворение мира Мировое яйцо Мифическое �...

 

Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada Februari 2023. Alice AbadamLahir(1856-01-02)2 Januari 1856London, InggrisMeninggal1940 (usia 84)Abergwili, Carmarthen, WalesDikenal atassufragis Alice Abadam (2 Januari 1856 – 1940) adalah seorang suffragette, feminis dan pembicara publik asal Wales. Kehidupan awa...

Mountain in Argentina SocompaSocompa as seen from near the Salar de Imilac.Highest pointElevation6,051 m (19,852 ft)[1]Prominence2,015 m (6,611 ft)[1]Parent peakOjos del SaladoListingUltra,Coordinates24°23′45.24″S 068°14′45.59″W / 24.3959000°S 68.2459972°W / -24.3959000; -68.2459972[1][2]GeographySocompaLocation in Argentina, on the border with Chile LocationArgentina – ChileParent rangeAndesGeology...

 

Gathering Co., Ltd.Nama asliギャザリング株式会社Nama latinGathering kabushiki gaishaJenisKabushiki gaishaIndustriStudio animasiDidirikan1 September 2015; 8 tahun lalu (2015-09-01)KantorpusatSoto-kanda, Chiyoda, Tokyo, JepangTokohkunciKazuhiro TodaTotal ekuitas¥10.000.000Karyawan10Situs webgathering.co.jpCatatan kaki / referensi[1] Gathering Co., Ltd. (Jepang: ギャザリング株式会社code: ja is deprecated , Hepburn: gyazaringu kabushiki gaisha) adalah sebuah...

 

Villa RoseberyResidenza estiva delPresidente della Repubblica ItalianaAltri nomiVilla Maria Pia LocalizzazioneStato Italia RegioneCampania LocalitàNapoli IndirizzoVia Ferdinando Russo, 26 Coordinate40°48′02.18″N 14°12′17.9″E / 40.800605°N 14.204972°E40.800605; 14.204972Coordinate: 40°48′02.18″N 14°12′17.9″E / 40.800605°N 14.204972°E40.800605; 14.204972 Informazioni generaliCondizioniIn uso Costruzione1801-1857 Stileneoclassico UsoR...

金正男遇刺现场,位于吉隆坡第二国际机场 金正男遇刺事件,是2017年2月13日已故朝鮮勞動黨總書記金正日的長子,也是現任領導人金正恩的兄長金正男於吉隆坡第二国际机场被2名女子刺殺身亡的事件。 事件经过 2017年2月6日,一名持姓名为「金哲」的朝鲜民主主义人民共和国外交护照的男子搭機抵达马来西亚,在2月8日前往浮羅交怡並在浮羅交怡威斯汀酒店(The Westin Langkaw...

 

周處除三害The Pig, The Snake and The Pigeon正式版海報基本资料导演黃精甫监制李烈黃江豐動作指導洪昰顥编剧黃精甫主演阮經天袁富華陳以文王淨李李仁謝瓊煖配乐盧律銘林孝親林思妤保卜摄影王金城剪辑黃精甫林雍益制片商一種態度電影股份有限公司片长134分鐘产地 臺灣语言國語粵語台語上映及发行上映日期 2023年10月6日 (2023-10-06)(台灣) 2023年11月2日 (2023-11-02)(香�...

 

Activities and objectives of the United States in the Middle East U.S. Marines on guard duty in April 2003 near a burning oil well in the Rumaila oil field of Basra, Iraq, following the 2003 U.S. invasion and during the Iraq War. United States foreign policy in the Middle East has its roots in the early 19th-century Tripolitan War that occurred shortly after the 1776 establishment of the United States as an independent sovereign state, but became much more expansive in the aftermath of World ...

تلوث الهواءمعلومات عامةصنف فرعي من تلوث بيئيتلوثemission (en) جانب من جوانب air quality (en) الأسباب سيارة بمحركأنواع الثورات البركانيةحرائق الغابات تسبب في ضخانمرض تنفسيسرطان الرئة عبء المرض 4٬353٬000 عدد الحالات[1] (2010)1٬476٬000 عدد الحالات[1] (2010)1٬001٬000 عدد الحالات[1] (2010) تعديل -...

 

Annual publication of university rankings Times Higher Education World University RankingsEditorPhil BatyCategoriesHigher educationFrequencyAnnualPublisherTimes Higher EducationFirst issue2004; 20 years ago (2004) (in partnership with QS)2010; 14 years ago (2010) (on its own)CountryUnited KingdomLanguageEnglishWebsitewww.timeshighereducation.com/world-university-rankings/ The Times Higher Education World University Rankings, often referred to as the THE Ran...

 

Abandoned World War II military airfield in Tunisia El Djem Airfield Coordinates35°19′02.17″N 010°40′40.97″E / 35.3172694°N 10.6780472°E / 35.3172694; 10.6780472 (Approximate)TypeMilitary airfieldSite informationControlled byUnited States Army Air ForcesSite historyBuilt1943In use1943-1944 El Djem Airfieldclass=notpageimage| Location of El Djem, Tunisia El Djem Airfield is an abandoned World War II military airfield in Tunisia, which is locat...

Hindu and Buddhist pilgrimage site in Mustang, Nepal This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) This article includes a list of general references, but it lacks sufficient corresponding inline citations. Please help to improve this article by introducing more precise citations. (July 2019) (Learn how and when to remove this message) This article is written like a research paper or sc...

 

Questa voce sull'argomento stagioni delle società calcistiche italiane è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. Voce principale: Unione Sportiva Lecce. US LecceStagione 1930-1931Sport calcio Squadra Lecce Allenatore Pietro Piselli Presidente N. Nanucchi Serie B14º Maggiori presenzeCampionato: Lavè (32) Miglior marcatoreCampionato: Benatti (11)Totale: Benatti (11) StadioAchille Starace (1...