Вероятностный латентно-семантический анализ

Вероятностный латентно-семантический анализ (ВЛСА), также известный как вероятностное латентно-семантическое индексирование (ВЛСИ, особенно в области информационного поиска) — это статистический метод анализа корреляции двух типов данных. Данный метод является дальнейшим развитием латентно-семантического анализа. ВЛСА применяется в таких областях как информационный поиск, обработка естественного языка, машинное обучение и смежных областях. Данный метод был впервые опубликован в 1999 году Томасом Хофманом (Thomas Hofmann)[1].

По сравнению с обычным латентно-семантическим анализом, который основан на линейной алгебре и является способом снижения размерности матрицы (как правило, с помощью разложения диагональной матрицы по сингулярным значениям), вероятностный латентно-семантический анализ основан на смешанном разложении, в свою очередь берущим своё начало из модели скрытых классов. Данный подход более принципиален, поскольку имеет прочную основу в области статистики.

Варианты pLSA

  • Иерархические расширения:
    • Асимметричное: MASHA («Multinomial ASymmetric Hierarchical Analysis», «полиномиальный асимметричный иерархический анализ»)[2]
    • Симметричное: HPLSA («Hierarchical Probabilistic Latent Semantic Analysis», «Иерархический вероятностный латентно-семантический анализ»),[3]
  • Генеративные модели: разработаны для решения часто критикуемых недостатков pLSA, а именно — того, что он является неправильной порождающей моделью для новых документов.
  • Данные высшего порядка: Хотя это редко обсуждается в научной литературе, pLSA, естественно, примени́м и для данных более высокого порядка (трёхуровневых и выше), то есть он может моделировать совместное поведение трёх и более переменных. В симметричной формулировке, данной выше, это делается простым добавлением условного распределения вероятностей для этих дополнительных переменных. Это вероятностный аналог неотрицательной тензорной факторизации.

Примечания

  1. Thomas Hofmann, Probabilistic Latent Semantic Indexing Архивировано 14 декабря 2010 года., Proceedings of the Twenty-Second Annual International SIGIR[англ.] Conference on Research and Development in Information Retrieval (SIGIR-99), 1999
  2. Alexei Vinokourov and Mark Girolami, A Probabilistic Framework for the Hierarchic Organisation and Classification of Document Collections, in Information Processing and Management, 2002
  3. Eric Gaussier, Cyril Goutte, Kris Popat and Francine Chen, A Hierarchical Model for Clustering and Categorising Documents Архивная копия от 13 марта 2006 на Wayback Machine, in «Advances in Information Retrieval — Proceedings of the 24th BCS-IRSG European Colloquium on IR Research (ECIR-02)», 2002

См. также

Read other articles:

Ramayya VasthavayyaNama lainరామయ్య వస్తావయ్యాSutradaraHarish ShankarProduserDil RajuSkenarioSatish VegesnaRamesh ReddyCeritaHarish ShankarPemeranN. T. Rama Rao Jr.Samantha Ruth PrabhuShruti HaasanP. RavishankarPenata musikS. ThamanSinematograferChota K. NaiduPenyuntingGautham RajuPerusahaanproduksiSri Venkateswara CreationsTanggal rilis 11 Oktober 2013 (2013-10-11) Durasi159 menitNegaraIndiaBahasaTeluguAnggaran₹45 crore (US$6,3 juta)[...

 

Sumber referensi dari artikel ini belum dipastikan dan mungkin isinya tidak benar. Mohon periksa, kembangkan artikel ini, dan tambahkan sumber yang benar pada bagian yang diperlukan. (Pelajari cara dan kapan saatnya untuk menghapus pesan templat ini) Artikel ini tidak memiliki referensi atau sumber tepercaya sehingga isinya tidak bisa dipastikan. Tolong bantu perbaiki artikel ini dengan menambahkan referensi yang layak. Tulisan tanpa sumber dapat dipertanyakan dan dihapus sewaktu-waktu.Cari s...

 

هذه المقالة يتيمة إذ تصل إليها مقالات أخرى قليلة جدًا. فضلًا، ساعد بإضافة وصلة إليها في مقالات متعلقة بها. (يناير 2018) Ki-51Mitsubishi Ki-51معلومات عامةالنوع قاذفة خفيفة/قاذفة انقضاضيةالمهام طائرة هجوم أرضي التطوير والتصنيعالصانع ميتسوبيشي للصناعات الثقيلةالكمية المصنوعة 2,385[1]...

1910 Maine gubernatorial election ← 1908 September 12, 1910 1912 →   Nominee Frederick W. Plaisted Bert M. Fernald Party Democratic Republican Popular vote 73,304 64,644 Percentage 52.01% 45.86% Governor before election Bert M. Fernald Republican Elected Governor Frederick W. Plaisted Democratic The 1910 Maine gubernatorial election took place on September 12, 1910. Incumbent Republican Governor Bert M. Fernald was defeated for re-election by Democratic candid...

 

アビスパ福岡原語表記 アビスパ福岡呼称 アビスパ福岡愛称 アビスパクラブカラー   ネイビー[1]  ブルーヴェールダンス[1]  シルバー[1]創設年 1982年所属リーグ 日本プロサッカーリーグ所属ディビジョン J1リーグクラブライセンス J1ホームタウン 福岡県福岡市[1]ホームスタジアム ベスト電器スタジアム[1]収容人数 21,562[1]運...

 

В Википедии есть статьи о других людях с фамилией Ходаковский. Игорь Львович Ходаковский Дата рождения 4 апреля 1941(1941-04-04) Дата смерти 30 июля 2012(2012-07-30) (71 год) Научная сфера термодинамика природных процессов Учёная степень доктор химических наук Награды и премии Игорь Л�...

  نيتيروي نيتيروي نيتيروي  خريطة الموقع تاريخ التأسيس 22 نوفمبر 1573  تقسيم إداري البلد البرازيل  [1][2] التقسيم الأعلى ريو دي جانيرو  خصائص جغرافية إحداثيات 22°53′00″S 43°06′13″W / 22.883333333333°S 43.103611111111°W / -22.883333333333; -43.103611111111  [3] المساحة 133.916 كيل...

 

 EW7 Stasiun MRT Eunos友诺士地铁站யூனுஸ்Angkutan cepatPeron stasiun EW7 Eunos di malam hariLokasi30 Eunos CrescentSingapura 409423Koordinat1°19′11.01″N 103°54′11.19″E / 1.3197250°N 103.9031083°E / 1.3197250; 103.9031083Jalur  Jalur Timur Barat Jumlah peronPulauJumlah jalur2LayananBus, TaksiKonstruksiJenis strukturMelayangTinggi peron2Akses difabelYesInformasi lainKode stasiunEW7SejarahDibuka4 November 1989Operasi layana...

 

Greek courtier and painting subject (died 1872) Stieler's portrait of Katerina Botsari Katerina Rosa Botsari (Greek: Κατερίνα Μπότσαρη; 1818/20–1872) was a Greek courtier. She was member of the Souliot Botsaris family. The daughter of Markos Botsaris, she was in the service of Queen Amalia of Greece as well as an admired young woman throughout the European courts - she was immortalised for the 'Gallery of Beauties' of Ludwig I of Bavaria in an 1841 painting by Joseph Stieler...

American baseball player (born 1988) Baseball player Blake TreinenTreinen with the Washington Nationals in 2014Los Angeles Dodgers – No. 49PitcherBorn: (1988-06-30) June 30, 1988 (age 35)Wichita, Kansas, U.S.Bats: RightThrows: RightMLB debutApril 12, 2014, for the Washington NationalsMLB statistics (through 2022 season)Win–loss record36–31Earned run average2.86Strikeouts504Saves79 Teams Washington Nationals (2014–2017) Oakland Athletics (2017–2019) Los Angeles Do...

 

7th chapter of the Qur'an Sura 7 of the Quranٱلْأَعْرَاف‎ Al-AʿrafThe ElevationArabic textEnglish translationClassificationMeccanOther namesThe PurgatoryPositionJuzʼ 8—9Hizb no.16—18No. of Rukus24No. of verses206No. of Sajdahs1 (verse 206)No. of words3341No. of letters14435Opening muqaṭṭaʻātʾAlif Lām Mīm Ṣād المص← Quran 6Quran 8 → Quran History Waḥy First revelation Asbab al-Nuzul Historicity Manuscripts Samarkand Kufic Quran Sana...

 

The flag and the coat of arms of Johor are state symbols of Johor, Malaysia. Like other states of Malaysia with Malay royalties, the state symbols of Johor are influenced by Johor's royalties, as well as Islam and the political and natural features of the state. Flag JohorUseCivil and state flagProportion1:2Adopted1871DesignNavy blue with a bright red field on the upper left canton, containing a white crescent and five-pointed star The flag, flown alongside the federal flag in front of the S...

American baseball player Baseball player Shooty BabittBabitt in 1984Second BasemanBorn: (1959-03-09) March 9, 1959 (age 65)Oakland, CaliforniaBatted: RightThrew: RightMLB debutApril 9, 1981, for the Oakland AthleticsLast MLB appearanceSeptember 4, 1981, for the Oakland AthleticsMLB statisticsBatting average.256Home runs0Runs batted in14 Teams Oakland Athletics (1981) Mack Neal Shooty Babitt (born March 9, 1959) is an American former second baseman who played...

 

Transfers genetic material between cells For other uses, see Vector. In molecular cloning, a vector is any particle (e.g., plasmids, cosmids, Lambda phages) used as a vehicle to artificially carry a foreign nucleic sequence – usually DNA – into another cell, where it can be replicated and/or expressed.[1] A vector containing foreign DNA is termed recombinant DNA. The four major types of vectors are plasmids, viral vectors, cosmids, and artificial chromosomes. Of these, the most co...

 

Mimata 三股町Kota kecil BenderaLambangLokasi Mimata di Prefektur MiyazakiNegara JepangWilayahKyūshūPrefektur MiyazakiDistrikKitamorokataLuas • Total110 km2 (40 sq mi)Populasi (Oktober 1, 2015) • Total25.404 • Kepadatan230,95/km2 (59,820/sq mi)Zona waktuUTC+9 (Waktu Standar Jepang)Kode pos889-1995Simbol • PohonGinkgo biloba• BungaRhododendron indicum• BurungEmberiza cioidesNomor telepon0986-52-1111Alama...

LVTP-5 LVTP-5类型兩棲裝甲運兵車原产地 美国服役记录服役期间1952-参与战争/衝突1958年黎巴嫩危機越戰生产历史研发者博格華納研发日期1950-1951制造数量1124基本规格重量37.4公噸长度9.04公尺宽度3.57公尺高度2.92公尺操作人数3+34 乘員装甲6-16公厘的鋼質裝甲主武器M1919A4機槍(A、A1)、白朗寧M2重機槍(A1與其他款式)、M240通用機槍(LVTH-6)、M49 24倍徑105mm榴彈炮(LVTH-6)、工蜂四型(LVTP-...

 

الحدثكأس ألمانيا 2015–16 بايرن ميونخ بوروسيا دورتموند 0 0 التاريخ21 مايو 2016  الملعبالملعب الأولمبي  الحكمماركو فريتز  الحضور74322   →نهائي كأس ألمانيا 2015  نهائي كأس ألمانيا 2017  ← نهائي كأس ألمانيا 2016 هي المباراة النهائية من منافسة كأس ألمانيا 2015–16، أقيمت المب�...

 

Nigerian actor, director and producer (born 1975) Kunle AfolayanAfolayan at the 2014 Africa Magic Viewers Choice AwardsBorn (1975-09-30) 30 September 1975 (age 48)[1]Ebute Metta, Lagos, Lagos State, NigeriaNationalityNigerianAlma materNew York Film AcademyOccupationsActorDirectorProducerYears active1999-PresentKnown forSaworoide, Agogo Ewo, Phone Swap, 1 OctoberSpouse Tolu Afolayan ​ ​(m. 2007; div. 2019)​Children4Par...

Municipality in Minas Gerais, Brazil PlaceCoromandelLocation of CoromandelCoordinates: 18°28′22″S 47°12′00″W / 18.47278°S 47.20000°W / -18.47278; -47.20000Founded7 September 1923Population (2020 [1]) • Total27,966Time zoneUTC−3 (BRT) Coromandel is a Brazilian municipality, located in the southeast region of the country, in the state of Minas Gerais. Its population is estimated at 27,966 people as of 2020. The municipality (mun...

 

Ansicht des Haupteingangsbereichs Das Krematorium Wedding ist ein ehemaliges Krematorium auf dem Urnenfriedhof Gerichtstraße im Berliner Ortsteil Wedding, das von 1912 bis 2001 in Betrieb war. Das denkmalgeschützte Gebäude[1] beherbergt seit dem Herbst 2015 das interdisziplinäre Kulturquartier silent green. Inhaltsverzeichnis 1 Lage 2 Geschichte 3 Neue Nutzung seit 2015 4 Baubeschreibung 5 Literatur 6 Weblinks 7 Einzelnachweise Lage Das ehemalige Krematorium trägt die Adresse Ger...