Дивергенция Йенсена — Шеннона

Дивергенция Йенсена — Шеннона[1] — это метод измерения похожести двух распределений вероятностей. Она известна также как информационный радиус[2] или полное отклонение от среднего[3]. Дивергенция базируется на дивергенции Кульбака — Лейблера с некоторыми существенными (и полезными) отличиями, среди которых, что она симметрична и всегда имеет конечное значение. Квадратный корень из дивергенции Йенсена — Шеннона является метрикой, которая часто упоминается как расстояние Йенсена — Шеннона[4][5][6].

Определение

Рассмотрим множество распределений вероятности, где A — это множество, снабжённое некоторой сигма-алгеброй измеримых подмножеств. В частности, мы можем взять в качестве A конечное или счётное множество, в котором все подмножества измеримы.

Дивергенция Йенсена — Шеннона (англ. Jensen–Shannon divergence, JSD)  — это симметризованная и сглаженная версия дивергенции Кульбака — Лейблера . Она определяется как

,

где

Недавно было предложено обобщение дивергенции Йенсена — Шеннона, в котором вместо арифметического среднего используется абстрактное среднее (наподобие геометрического или гармонического среднего)[7]. Геометрическая дивергенция Йенсена — Шеннона (англ. G-Jensen–Shannon divergence) даёт явную a формулу дивергенции между двумя гауссовыми распределениями путём применения геометрического среднего.

Более общее определение, позволяющее сравнить более двух распределений вероятности (См):

,

где являются весами, выбранными для распределений вероятности , а является энтропией Шеннона для распределения . Для случая двух распределений

Границы

Дивергенция Йенсена — Шеннона ограничена 1 для двух распределений вероятности, если (в дивергенции Кульбака — Лейблера) используется логарифм по основанию 2[8]

С такой нормализацией дивергенция Йенсена — Шеннона является нижней границей полного расстояния вариации[англ.] между P и Q:

Для натурального логарифма, который обычно используется в статистической термодинамике, верхняя граница равна ln(2):

Дивергенция Йенсена — Шеннона ограничена величиной для более двух распределений вероятности, если используется логарифм по основанию 2[8]

Связь со взаимной информацией

Дивергенция Йенсена — Шеннона является взаимной информацией между случайной переменной , ассоциированной со смесью распределений[англ.] между и и двоичной индикаторной переменной , которая используется для переключения между и для получения смеси. Пусть будет некоторой функцией на множестве событий, которая хорошо различает события, и выберем значение согласно , если , и согласно , если , где равновероятно. То есть мы выбираем согласно мере , и его распределение является смесью распределений. Мы вычисляем

Из результатов выше следует, что дивергенция Йенсена — Шеннона ограничена 0 и 1, поскольку взаимная информация неотрицательна и ограничена величиной . Дивергенция Йенсена — Шеннона не всегда ограничена 0 и 1 — здесь верхняя граница 1 возникает из-за того, что мы рассматриваем конкретный случай двоичной переменной .

Можно применить тот же принцип для совместного распределения и произведения этих двух крайних распределений (по аналогии с дивергенцией Кульбака — Лейблера и взаимной информацией) и измерить, насколько достоверно можно решить, что результат получен от совместного распределения или от произведения распределений при предположении, что имеются только эти две возможности[9].

Квантовая дивергенция Йенсена — Шеннона

Обобщение распределений вероятности на матрицы плотности позволяет определить квантовую дивергенцию Йенсена — Шеннона (англ. quantum Jensen–Shannon divergence, QJSD)[10][11]. Она определяется для множества матриц плотности и распределений вероятности как

где является энтропией фон Неймана[англ.] плотности . Эта величина вводится в теории квантовой информации, где называется информацией Холево — она даёт верхнюю границу для количества классической информации, закодированной квантовыми состояниями при априорных распределениях (см. статью «Теорема Холево»)[12]. Квантовая Дивергенция Йенсена — Шеннона для и двух матриц плотности является ограниченной всюду заданной симметричной функцией и равна нулю, только если две матрицы плотности совпадают. Она равна квадрату метрики чистых состояний[13] и недавно было показано, что это метрическое свойство выполняется и для смешанных состояний[14][15]. Метрика Бюреса[англ.] тесно связана с квантовой дивергенцией Йенсена — Шеннона и является квантовым аналогом информационной метрики Фишера.

Обобщение

Нильсен ввёл косую K-дивергенцию[16]: Отсюда получаем однопараметрическое семейство дивергенций Йенсена — Шеннона, называемое -дивергенциями Йенсена — Шеннона:

которое включает дивергенцию Йенсена — Шеннона (для ) и половину дивергенции Джеффриса (для ).

Приложения

Дивергенция Йенсена — Шеннона применяется в биоинформатике и сравнении геномов[англ.][17][18], при сравнении поверхностей белков[19], в общественных науках[20], при количественных исследованиях в истории[21], экспериментах с огнём[22] и машинном обучении [23].

Примечания

  1. В русскоязычной литературе чаще встречается неверное название «Дивергенция Дженсена — Шеннона»
  2. Schütze, Manning, 1999, с. 304.
  3. Dagan, Lee, Pereira, 1997, с. 56–63.
  4. Endres, Schindelin, 2003, с. 1858–1860.
  5. Ôsterreicher, Vajda, 2003, с. 639–653.
  6. Fuglede, Topsoe, 2004, с. 30.
  7. Nielsen, Frank (2019). "On a generalization of the Jensen-Shannon divergence and the JS-symmetrization of distances relying on abstract means". arXiv:1904.04017 [cs.IT].
  8. 1 2 Lin, 1991, с. 145–151.
  9. Schneidman, Bialek, Berry, 2003.
  10. Majtey, Lamberti, Prato, 2005, с. 052310.
  11. Briët, Harremoës, 2009, с. 052311.
  12. Холево, 1973, с. 3–11.
  13. Braunstein, Caves, 1994, с. 3439–3443.
  14. Virosztek, Dániel (2019). "The metric property of the quantum Jensen-Shannon divergence". arXiv:1910.10447.
  15. Sra, Suvrit (2019). "Metrics Induced by Quantum Jensen-Shannon-Renyí and Related Divergences". arXiv:1911.02643.
  16. Nielsen, Frank (2010). "A family of statistical symmetric divergences based on Jensen's inequality". arXiv:1009.4004 [cs.CV].
  17. Sims, Jun, Wu, Kim, 2009, с. 2677–82.
  18. Itzkovitz, Hodis, Segal, 2010, с. 1582–9.
  19. Ofran, Rost, 2003, с. 377–87.
  20. DeDeo, Hawkins, Klingenstein, Hitchcock, 2013, с. 2246–2276.
  21. Klingenstein, Hitchcock, DeDeo, 2014, с. 9419–9424.
  22. Mitroi-Symeonidis, Anghel, Minculete, 2020, с. 22.
  23. Goodfellow, Pouget-Abadie и др., 2014.

Литература

Литература для дальнейшего чтения

  • Frank Nielsen (2010). "A family of statistical symmetric divergences based on Jensen's inequality". arXiv:1009.4004 [cs.CV].

Ссылки

Read other articles:

Lege Melolonthini Melolontha melolontha (en) TaksonomiKerajaanAnimaliaFilumArthropodaKelasInsectaOrdoColeopteraFamiliScarabaeidaeTribusMelolonthini Samouelle, 1819 lbs Melolonthini atau kumbang lege adalah suku kumbang skarab dalam keluarga Scarabaeidae .[1] Ada lebih dari 250 genera di Melolonthini, yang terdapat di seluruh dunia; ada lebih dari 300 spesies di Amerika Utara saja, dan lebih dari 3000 di seluruh dunia. [2] [3] Genera terpilih Amblonoxia Reitter, 1902 Am...

 

 

Bill of Rights di Arsip Nasional. Amandemen Kedua (Amandemen II) terhadap Konstitusi Amerika Serikat melindungi hak individu untuk memegang dan membawa senjata.[1][2] Amandemen ini disahkan pada 15 Desember 1791 sebagai bagian dari Bill of Rights.[3][4][5] Referensi ^ https://www.law.cornell.edu/wex/second_amendment ^ Salinan arsip (PDF). Diarsipkan dari versi asli (PDF) tanggal 2013-03-02. Diakses tanggal 2019-08-09.  ^ US Senate Annotated Constit...

 

 

Butler County, AlabamaButler County courthouse in Greenville, AlabamaLokasi di negara bagian AlabamaLokasi negara bagian Alabama di Amerika SerikatDidirikanDecember 13, 1819SeatGreenvilleKota terbesarGreenvilleWilayah • Keseluruhan778 sq mi (2.015 km2) • Daratan777 sq mi (2.012 km2) • Perairan1 sq mi (3 km2), 0.13%Populasi • (2000)21.399 • Kepadatan28/sq mi (11/km²) County Butler ada...

Историческое государствоИмперия Хотакипушту ‎هوټکی‎ перс. هوتاکی‎ Флаг ← ←   → 1709 — 1738 Столица Кандагар (1709–1722), (1725–1738) Исфахан (1722–1729) Официальный язык Персидский и Пушту Религия Ислам суннитского толка Форма правления Абсолютная монархия Эмир  •&...

 

 

Европейская сардина Научная классификация Домен:ЭукариотыЦарство:ЖивотныеПодцарство:ЭуметазоиБез ранга:Двусторонне-симметричныеБез ранга:ВторичноротыеТип:ХордовыеПодтип:ПозвоночныеИнфратип:ЧелюстноротыеГруппа:Костные рыбыКласс:Лучепёрые рыбыПодкласс:Новопёры...

 

 

Varieties of Arabic of the Arabian Peninsula Peninsular ArabicArabian ArabicRegionArabian PeninsulaNative speakers77 million (2018–2023)[1]Language familyAfro-Asiatic SemiticWest SemiticCentral SemiticArabicPeninsular ArabicDialects Gulf Bahrani Omani Hejazi Shihhi Dhofari Yemeni Bedawi Najdi Bareqi Writing systemArabic scriptLanguage codesISO 639-3Variously:abv – Bahrani Arabicadf – Dhofari Arabicavl – Eastern Egyptian Bedawi Arabicafb ...

United States Space Force military communications satellite constellation USA-204Artist's impression of a WGS-2 satellite in orbitNamesWGS-2WGS SV-2Wideband Global SATCOM-2Mission typeMilitary communicationsOperatorUnited States Air Force / United States Space ForceCOSPAR ID2009-017A SATCAT no.34713Websitehttps://www.spaceforce.mil/Mission duration14 years (planned)15 years and 1 month (in progress) Spacecraft propertiesSpacecraftWGS-2Spacecraft typeWGS Block IBusBSS-702Manufacturer...

 

 

Pour les articles homonymes, voir Darquier. Louis Darquier Louis Darquier vers 1942-1944. Fonctions Commissaire général aux questions juives (Vichy) 8 mai 1942 – 26 février 1944(1 an, 9 mois et 18 jours) Gouvernement Laval (6)(Vichy) Prédécesseur Xavier Vallat Successeur Charles du Paty de Clam Conseiller municipal de Paris 1935 – 1940(5 ans) Biographie Nom de naissance Louis Darquier Date de naissance 19 décembre 1897 Lieu de naissance Cahors, Lot, France Date ...

 

 

1644 battle of the Torstenson War Battle of KoldingPart of the Torstenson WarRobert Douglas, Unknown authorDateJanuary 9, 1644LocationKolding, Denmark-NorwayResult Swedish victory[1]Belligerents Swedish Empire Denmark-NorwayCommanders and leaders Robert Douglas Fredrik BuchwaldtStrength 7,000 6,000Casualties and losses 200 killed and wounded 500 killed and wounded vteThirty Years' War Bohemian Revolt (1618–1620) Pilsen Lomnice Sablat Wisternitz Bautzen White Mountain Neu Titschein P...

American baseball pitcher (born 1994) Baseball player Dane DunningDunning with the Birmingham Barons in 2018Texas Rangers – No. 33PitcherBorn: (1994-12-20) December 20, 1994 (age 29)Orange Park, Florida, U.S.Bats: RightThrows: RightMLB debutAugust 19, 2020, for the Chicago White SoxMLB statistics (through April 23, 2024)Win–loss record25–27Earned run average4.19Strikeouts455 Teams Chicago White Sox (2020) Texas Rangers (2021–present) Career highlights and awards Wo...

 

 

此条目序言章节没有充分总结全文内容要点。 (2019年3月21日)请考虑扩充序言,清晰概述条目所有重點。请在条目的讨论页讨论此问题。 哈萨克斯坦總統哈薩克總統旗現任Қасым-Жомарт Кемелұлы Тоқаев卡瑟姆若马尔特·托卡耶夫自2019年3月20日在任任期7年首任努尔苏丹·纳扎尔巴耶夫设立1990年4月24日(哈薩克蘇維埃社會主義共和國總統) 哈萨克斯坦 哈萨克斯坦政府...

 

 

Волгоградский алюминиевый завод В одном из цехов Год основания 1955 Расположение  Россия  Волгоград Ключевые фигуры Белотелов Александр Юрьевич (генеральный директор) Отрасль цветная металлургия (МСОК: 2420) Продукция алюминиевый сплав и алюминий Число работ...

Halaman ini berisi artikel tentang bintang. Untuk kegunaan lain, lihat Matahari (disambiguasi). Mentari beralih ke halaman ini. Untuk kegunaan lain, lihat Mentari (disambiguasi). Surya beralih ke halaman ini. Untuk kegunaan lain, lihat Surya (disambiguasi). Matahari Diproyeksikan dalam cahaya tampak dengan filter surya pada tahun 2019 dengan bintik matahari dan penggelapan tepiGambar berwarna semu yang diambil pada tahun 2010 yang diproyeksikan oleh sinar ultraungu (panjang gelombang 30,4 nm)...

 

 

Частина серії проФілософіяLeft to right: Plato, Kant, Nietzsche, Buddha, Confucius, AverroesПлатонКантНіцшеБуддаКонфуційАверроес Філософи Епістемологи Естетики Етики Логіки Метафізики Соціально-політичні філософи Традиції Аналітична Арістотелівська Африканська Близькосхідна іранська Буддій�...

 

 

Национальное аэрокосмическое агентство Азербайджана Штаб-квартира Баку, ул. С. Ахундова, AZ 1115 Локация  Азербайджан Тип организации Космическое агентство Руководители Директор: Натиг Джавадов Первый заместитель генерального директора Тофик Сулейманов Основание Осн�...

2011 book by Corey Robin The Reactionary Mind AuthorCorey RobinCountryUnited StatesLanguageEnglishSubjectConservatism, politicsPublisherOxford University PressPublication date2011Media typePrintPages304ISBN0199793743OCLC848950936Dewey Decimal305.32 21LC ClassJC573 .R63 2011 The Reactionary Mind: Conservatism from Edmund Burke to Sarah Palin is a 2011 book written by political theorist Corey Robin. It argues that conservatism from the 17th century to today is based on the principle t...

 

 

維也納歌劇海報 建於1778年米蘭斯卡拉大劇院,世界上最為著名的一大歌劇院。 歌劇(義大利語:opera,opere為複數形)是一門西方舞臺表演藝術,簡單而言就是主要或完全以歌唱和音樂來交代和表達劇情的戲劇。[1] 歌劇在17世紀,即1600年前後才出现在意大利的佛羅倫斯,它源自古希臘戲劇的劇場音樂。歌劇的演出和戲劇的所需一樣,都要憑藉劇場的典型元素,如背景...

 

 

Location of Harris County in Texas Map all coordinates using OpenStreetMap Download coordinates as: KML GPX (all coordinates) GPX (primary coordinates) GPX (secondary coordinates) This is a list of the National Register of Historic Places in Harris County, Texas. It is intended to be a complete list of properties and districts listed on the National Register of Historic Places in Harris County, Texas, United States. Contents: NRHP listings by area in Harris County   downtown Houston - H...

Human settlement in EnglandWroxallSt. John's Church, Wroxall village centre.WroxallLocation within the Isle of WightPopulation1,753 (2011)[1]OS grid referenceSZ550798Civil parishWroxallUnitary authorityIsle of WightCeremonial countyIsle of WightRegionSouth EastCountryEnglandSovereign stateUnited KingdomPost townVENTNORPostcode districtPO38Dialling code01983PoliceHampshire and Isle of WightFireHampshire and Isle of WightAmbulanceIsle of Wight UK...

 

 

Minimum sampling rate to avoid aliasing Not to be confused with Nyquist frequency. Fig 1: Typical example of Nyquist frequency and rate. They are rarely equal, because that would require over-sampling by a factor of 2 (i.e. 4 times the bandwidth). In signal processing, the Nyquist rate, named after Harry Nyquist, is a value equal to twice the highest frequency (bandwidth) of a given function or signal. It has units of samples per unit time, conventionally expressed as samples per second, or h...