Теорема Байеса

Формула Байеса

Теорема Байеса (или формула Байеса) — одна из основных теорем элементарной теории вероятностей, которая позволяет определить вероятность события при условии, что произошло другое статистически взаимозависимое с ним событие. Другими словами, по формуле Байеса можно уточнить вероятность какого-либо события, взяв в расчёт как ранее известную информацию, так и данные новых наблюдений. Формула Байеса может быть выведена из основных аксиом теории вероятностей, в частности из условной вероятности. Особенность теоремы Байеса заключается в том, что для её практического применения требуется большое количество расчётов, вычислений, поэтому байесовские оценки стали активно использовать только после революции в компьютерных и сетевых технологиях. На сегодняшний день активно применяется в машинном обучении и технологиях искусственного интеллекта.

При возникновении теоремы Байеса вероятности, используемые в теореме, подвергались целому ряду вероятностных интерпретаций. В одной из таких интерпретаций говорилось, что вывод формулы напрямую связан с применением особого подхода к статистическому анализу. Если использовать байесовскую интерпретацию вероятности, то теорема показывает, как личный уровень доверия может кардинально измениться вследствие количества наступивших событий. В этом заключаются выводы Байеса, которые стали основополагающими для байесовской статистики. Однако теорема не только используется в байесовском анализе, но и активно применяется для большого ряда других расчётов.

Психологические эксперименты[1] показали, что люди часто неверно оценивают реальную (математически верную) вероятность события, основываясь на некоем личном полученном опыте (апостериорная вероятность), поскольку игнорируют саму вероятность предположения (априорная вероятность). Поэтому правильный результат по формуле Байеса может сильно отличаться от интуитивно ожидаемого.

Теорема Байеса названа в честь её автора Томаса Байеса (1702—1761) — английского математика и священника, который первым предложил использование теоремы для корректировки убеждений, основываясь на обновлённых данных. Его работа «An Essay towards solving a Problem in the Doctrine of Chances» впервые опубликована в 1763 году[2], через 2 года после смерти автора. До того, как посмертная работа Байеса была принята и прочитана в Королевском обществе, она была значительно отредактирована и обновлена Ричардом Прайсом. Однако эти идеи не предавались публичной огласке до тех пор, пока не были вновь открыты и развиты Пьером-Симоном Лапласом, впервые опубликовавшим современную формулировку теоремы в своей книге 1812 года «Аналитическая теория вероятностей».

Сэр Гарольд Джеффрис писал, что теорема Байеса «для теории вероятности то же, что теорема Пифагора для геометрии»[3].

Формулировка

Формула Байеса:

,

где

— априорная вероятность гипотезы A (смысл такой терминологии см. ниже);
— вероятность гипотезы A при наступлении события B (апостериорная вероятность);
— вероятность наступления события B при истинности гипотезы A;
— полная вероятность наступления события B.

Доказательство

Формула Байеса вытекает из определения условной вероятности. Вероятность совместного события двояко выражается через условные вероятности

Следовательно

Вычисление P(B)

В задачах и статистических приложениях обычно вычисляется по формуле полной вероятности события, зависящего от нескольких несовместных гипотез, имеющих суммарную вероятность 1.

,

где вероятности под знаком суммы известны или допускают экспериментальную оценку.

В этом случае формула Байеса записывается так:

«Физический смысл» и терминология

Формула Байеса позволяет «переставить причину и следствие»: по известному факту события вычислить вероятность того, что оно было вызвано данной причиной. При этом необходимо понимать, для применения теоремы причинно-следственная связь между и не является обязательной.

События, отражающие действие «причин», в данном случае называют гипотезами, так как они — предполагаемые события, повлёкшие данное. Безусловную вероятность справедливости гипотезы называют априорной (насколько вероятна причина вообще), а условную — с учётом факта произошедшего события — апостериорной (насколько вероятна причина оказалась с учётом данных о событии).

Примеры

Пример 1

Пусть событие  — машина не заводится, а гипотеза  — в баке нет топлива. Очевидно, что вероятность того, что машина не заведётся, если в баке нет топлива, равняется единице. Как следствие, апостериорная вероятность, что в баке нет топлива, если машина не заводится, то есть , равна , то есть отношению априорной вероятности, что в баке нет топлива, к вероятности, что машина не заводится. Например, если априорная вероятность, что в баке нет топлива, равна 0,01, а вероятность, что машина не заводится, равна 0,02, и случайно выбранная машина не завелась, то вероятность, что в её баке нет топлива, равна 0,5.

Пример 2

Пусть вероятность брака у первого рабочего , у второго рабочего — , а у третьего — . Первый изготовил деталей, второй — деталей, а третий — деталей. Начальник цеха берёт случайную деталь, и она оказывается бракованной. Спрашивается, с какой вероятностью эту деталь изготовил третий рабочий.

Событие  — брак детали, событие  — деталь произвёл рабочий . Тогда , где , а .

По формуле полной вероятности

По формуле Байеса получим:

Пример 3

Древовидная диаграмма демонстрирует частотный пример. R, C, P и P c чёрточкой — это события, обозначающие, что жук является редким, обычным, с узором и без узора. Проценты в скобках вычисляются. Отметим, что значения трёх независимых событий даны, поэтому возможно вычислить обратное дерево (смотрите на график выше).

Энтомолог предполагает, что жук может относиться к редкому подвиду жуков, так как у него на корпусе есть узор. В редком подвиде 98 % жуков имеют узор, или P(узор | редкий) = 0,98. Среди обычных жуков только 5 % имеют узор: P(узор | обычный) = 0,05. Редкого вида жуков насчитывается лишь 0,1 % среди всей популяции: P(редкий) = 0,001. Какова вероятность того, что жук, имеющий узор, относится к редкому подвиду, то есть, чему равно P(редкий | узор)?

Из расширенной теоремы Байеса получаем (любой жук может относиться либо к редким, либо к обычным):

Пример 4 — парадокс теоремы Байеса

Пусть существует заболевание с частотой распространения среди населения 0,001 и метод диагностического обследования, который с вероятностью 0,9 выявляет больного, но при этом имеет вероятность 0,01 ложноположительного результата — ошибочного выявления заболевания у здорового человека (подробнее…). Найти вероятность того, что человек здоров, если он был признан больным при обследовании.

Обозначим событие что обследование показало, человек болен как «болен» с кавычками, болен — событие, что человек действительно больной, здоров — событие, что человек действительно здоров. Тогда заданные условия переписываются следующим образом:

, при этом , значит:

Вероятность того, что человек здоров, если он был признан больным равна условной вероятности:

Чтобы её найти, вычислим сначала полную вероятность признания больным:

Вероятность, что человек здоров при результате «болен»:

Таким образом, 91,7 % людей, у которых обследование показало результат «болен», на самом деле здоровые люди. Причина этого в том, что по условию задачи вероятность ложноположительного результата хоть и мала, но на порядок больше доли больных в обследуемой группе людей.

Если ошибочные результаты обследования можно считать случайными, то повторное обследование того же человека будет давать независимый от первого результат. В этом случае для уменьшения доли ложноположительных результатов имеет смысл провести повторное обследование людей, получивших результат «болен». Вероятность того, что человек здоров после получения повторного результата «болен», также можно вычислить по формуле Байеса:

Варианты интерпретации вероятностей в теореме Байеса

Математически теорема Байеса показывает взаимоотношения между вероятностью события A и вероятностью события B, P(A) и P(B), условной вероятности наступления события А при существующем B и наступлении события B при существующем A, P(A | B) и P(B | A).

В общей форме формула Байеса выглядит следующим образом:

Значение выражения зависит от того, как интерпретируются вероятности в данной формуле.

Интерпретация Байеса

В интерпретации Байеса вероятность измеряет уровень доверия. Теорема Байеса связывает воедино доверие предположению до и после принятия во внимание очевидных доказательств. Например, кто-то предположил, что при подкидывании монетки она будет приземляться в 2 раза чаще решкой вверх, а орлом вниз. Первоначально степень доверия, что такое событие случится, монета упадёт именно так — 50 %. Уровень доверия может увеличиться до 70 %, если предположение будет подтверждено доказательством.[прояснить]

Для предположения (гипотезы) A и доказательства B

  • P(A) — априорная вероятность гипотезы A, первоначальный уровень доверия предположению A;
  • P(A | B) — апостериорная вероятность гипотезы A при наступлении события B;
  • отношение P(B | A)/P(B) показывает, как событие B помогает изменить уровень доверия предположению A.

Частотная интерпретация

Иллюстрация частотной интерпретации

В частотной интерпретации теорема Байеса исчисляет доли определённых результатов события. Предположим, что некий эксперимент проводился много раз и в некоторых случаях приводил к результатам А и/или B. Тогда:

  • P(A) — доля случаев, когда эксперимент привёл к результату A.
  • P(B) — доля случаев, когда эксперимент привёл к результату B.
  • P(B | A) — доля случаев с результатом B среди случаев с результатом А.
  • P(A | B) — доля случаев с результатом A среди случаев с результатом B.

Роль теоремы Байеса лучше всего можно понять из древовидных диаграмм, представленных справа. Диаграммы демонстрируют различный порядок распределения событий по наличию или отсутствию результатов A и B. Теорема Байеса выступает как связующее звено этих распределений.

Формы

События

Простая форма

Для событий A и B, при условии, что P(B) ≠ 0,

Во многих дополнениях к теореме Байеса указывается, что событие B известно и нужно понять, как знание о событии B влияет на уверенность в том, что произойдёт событие A. В таком случае знаменатель последнего выражения — вероятность наступления события B — известен; мы хотим изменить A. Теорема Байеса показывает, что апостериорные вероятности пропорциональны числителю:

(пропорциональность A для данного B).
Если говорить кратко: апостериорная вероятность пропорциональна априорной вероятности (смотри Lee, 2012, Глава 1).

Если события A1, A2, …, взаимоисключающие и исчерпывающие, то есть возможно только одно из событий, одновременно два события не могут случиться вместе, мы можем определить коэффициент пропорциональности, ориентируясь на то, что их вероятности в сумме должны составлять единицу. Например, для данного события A — само событие A и его противоположность ¬A взаимоисключающие и исчерпывающие. Обозначая коэффициент пропорциональности как C мы имеем:

и .

Объединив эти две формулы, мы получим, что:

Расширенная форма

Часто пространство событий (таких как {Aj}) определённо в терминах P(Aj) и P(B | Aj). Именно в этом случае полезно определить P(B), применив формулу полной вероятности:

В частности

.

Непрерывные случайные величины

Диаграмма отображает смысл теоремы Байеса и применима к пространству событий, образованного непрерывными случайными величинами X и Y. Заметим, что по теореме Байеса для каждой точки в области существуют требования. На практике, эти требования могут быть представлены в параметрическом виде, с помощью обозначения плотности распределения как функция от x и y.

Рассмотрим пространство элементарных событий Ω, образованного двумя величинами X и Y. В принципе, теорема Байеса применяется к событиям A = {X = x} и B = {Y = y}. Однако выражения становятся равны 0 в точках, в которых переменная имеет конечную плотность вероятности. Для того, чтобы с пользой продолжать использовать теорему Байеса, можно её сформулировать в терминах подходящих плотностей (смотрите Вывод формул).

Простая форма

Если X непрерывна и Y дискретна, то

Если X дискретна и Y непрерывна,

Если как X, так и Y непрерывны,

Расширенная форма

Диаграмма, показывающая, как пространство событий, образованное непрерывными случайными величинами X и Y, часто определяется.

Непрерывное пространство событий часто определяется как числитель условий A. Непрерывное пространство событий часто представляют как числитель. В дальнейшем полезно избавиться от знаменателя, используя формулу общей вероятности. Для 'fY(y), это становится интегралом:

Правило Байеса

Правило Байеса — это преобразованная теорема Байеса:

где

Это называется правилом Байеса или отношением правдоподобия. Разница в вероятности наступления двух событий — это просто отношение вероятностей этих двух событий. Таким образом,

,
,

Вывод формул

Для событий

Теорема Байеса может быть получена из определения вероятности:

Для случайных переменных

Для двух непрерывных случайных величин X и Y теорема Байеса может быть аналогично выведена из определения условного распределения:

См. также

Примечания

Литература

  • Гмурман В. Е. Теория вероятностей и математическая статистика, — М.: Высшее образование. 2005
  • Judgment under Uncertainty: Heuristics and Biases / Daniel Kahneman, et al. — 21st. — Cambridge University Press, 2005. — 555 p. — ISBN 978-0-521-28414-1.
  • McGrayne, Sharon Bertsch. The Theory That Would Not Die: How Bayes' Rule Cracked the Enigma Code, Hunted Down Russian Submarines & Emerged Triumphant from Two Centuries of Controversy (англ.). — Yale University Press, 2011. — ISBN 978-0-300-18822-6.
  • Andrew Gelman, John B. Carlin, Hal S. Stern, and Donald B. Rubin (2003), «Bayesian Data Analysis», Second Edition, CRC Press.
  • Charles M. Grinstead and J. Laurie Snell (1997), «Introduction to Probability (2nd edition)», American Mathematical Society (free pdf available [1].
  • Pierre-Simon Laplace. (1774/1986), «Memoir on the Probability of the Causes of Events», Statistical Science 1(3):364-378.
  • Peter M. Lee (2012), «Bayesian Statistics: An Introduction», Wiley.
  • Rosenthal, Jeffrey S. (2005): «Struck by Lightning: the Curious World of Probabilities». Harper Collings.
  • Stephen M. Stigler (1986), «Laplace’s 1774 Memoir on Inverse Probability», Statistical Science 1(3):359-363.
  • Stone, JV (2013). Chapter 1 of book «Bayes’ Rule: A Tutorial Introduction», University of Sheffield, England.

Ссылки

Read other articles:

Zimbabwean tennis player Kevin UllyettCountry (sports) ZimbabweResidenceLondon, United KingdomBorn (1972-05-23) 23 May 1972 (age 51)Harare, ZimbabweHeight1.78 m (5 ft 10 in)Turned pro1990Retired2010PlaysRight-handed (one-handed backhand)Prize money$4,138,771SinglesCareer record21–34Career titles0 5 Challenger, 0 Futures Highest rankingNo. 107 (22 May 2000)Grand Slam singles resultsAustralian Open2R (2000)French OpenQ1 (1993, 1997)W...

 

 

Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada Desember 2023. Artikel atau sebagian dari artikel ini mungkin diterjemahkan dari List of accolades received by Gravity (film) di en.wikipedia.org. Isinya masih belum akurat, karena bagian yang diterjemahkan masih perlu diperhalus dan disempurnakan. Jika Anda menguas...

 

 

Peta menunjukkan lokasi Santa Ignacia Data sensus penduduk di Santa Ignacia Tahun Populasi Persentase 199030.470—199534.6582.6%200038.3012.17%200743.5601.79% Santa Ignacia adalah munisipalitas yang terletak di provinsi Tarlac, Filipina. Pada tahun 2010, munisipalitas ini memiliki populasi sebesar 43.787 jiwa. Pembagian wilayah Secara administratif Santa Ignacia terbagi menjadi 24 barangay, yaitu: Baldios Botbotones Caanamongan Cabaruan Cabugbugan Caduldulaoan Calipayan Macaguing Nambalan Pa...

United States Senator from Pennsylvania (1860-1921) Boies PenroseUnited States Senatorfrom PennsylvaniaIn officeMarch 4, 1897 – December 31, 1921Preceded byJ. Donald CameronSucceeded byGeorge PepperMember of theRepublican National Committeefrom PennsylvaniaIn officeMay 18, 1916 – December 31, 1921Preceded byHenry WassonSucceeded byGeorge PepperIn officeJune 9, 1904 – May 1, 1912Preceded byMatthew QuaySucceeded byHenry WassonChairman of the Republican State Com...

 

 

Variety of fungus Amanita excelsa var. spissa Scientific classification Domain: Eukaryota Kingdom: Fungi Division: Basidiomycota Class: Agaricomycetes Order: Agaricales Family: Amanitaceae Genus: Amanita Species: A. excelsa Variety: A. e. var. spissa Trinomial name Amanita excelsa var. spissa(Fr.) Neville & Poumerat. Synonyms Amanita spissa (Fr.) Opiz. Species of fungus Amanita excelsa var. spissaMycological characteristicsGills on hymenium Cap is convex or flatHymenium is freeS...

 

 

American political commentator (born 1941) This article is about the journalist. For the golfer, see George Will (golfer). George WillWill in 2022BornGeorge Frederick Will (1941-05-04) May 4, 1941 (age 82)Champaign, Illinois, U.S.EducationTrinity College (BA)Magdalen College, Oxford (MA)Princeton University (MA, PhD)OccupationsColumnistauthorEmployer(s)NewsweekThe Washington PostPolitical partyRepublican (before 2016)Independent (after 2016)Spouses Madeleine Will ​ ​(...

Maritime warfare branch of Greece's military This article is about the naval forces of modern Greece. For information on naval warfare in ancient Greece, see Hellenistic-era warships. Hellenic NavyΕλληνικό Πολεμικό ΝαυτικόHellenic Navy sealFounded1821 (de facto)1828 (official)Country GreeceRoleNational defenseSizec. 30,000 active personnel120 warships & auxiliary boats, including:13 frigates10 submarines19 missile boats10 gunboats9 tank-landing ships6 patrol bo...

 

 

Concours Eurovision de la chanson 2000 Dates Finale 13 mai 2000 Retransmission Lieu GlobenStockholm, Suède Présentateur(s) Kattis AhlströmAnders Lundin Superviseur exécutif Christine Marchal-Ortiz Télédiffuseur hôte SVT Ouverture Vues de la Suède Entracte Once Upon a Time Europe Was Covered With Ice, par Caroline Lundgren, Bounce et Strängnäs Drumcorps Participants Nombre de participants 24 Débuts Lettonie Retour Finlande Macédoine Roumanie Russie Suisse Relégation Bosnie-Herzé...

 

 

Aspect d'un terrain de cricket. La bande rectangulaire, au milieu du terrain, est la piste. Un terrain de cricket est une surface de gazon, généralement de forme légèrement ovale, sur laquelle se pratique le cricket. Au centre de celui-ci se trouve une surface rectangulaire sur laquelle se déroulent les lancers et où se trouvent les deux batteurs de l'équipe qui doit marquer : la piste. Description Forme et dimensions Corde servant à délimiter l'aire de jeu. Un terrain de cricke...

Questa voce o sezione deve essere rivista e aggiornata appena possibile. Sembra infatti che questa voce contenga informazioni superate e/o obsolete. Se puoi, contribuisci ad aggiornarla. Monogatari物語Logo della serie Generegiallo[1][2], soprannaturale[3], psicologico[4] Light novelTestiNisio Isin DisegniVofan EditoreKōdansha - Kōdansha Box 1ª edizione10 agosto 2005 – in corso Volumi29 (in corso) Editore it.Dokusho ...

 

 

Israeli footballer Almog Cohen Cohen signing autographs for 1. FC Nürnberg fans in 2011Personal informationDate of birth (1988-09-01) 1 September 1988 (age 35)Place of birth Beersheba, IsraelHeight 1.70 m (5 ft 7 in)Position(s) Defensive midfielderYouth career1998–2006 Beitar Tubruk2006–2007 Maccabi NetanyaSenior career*Years Team Apps (Gls)2007–2010 Maccabi Netanya 89 (8)2010–2013 1. FC Nürnberg 58 (2)2013 → Hapoel Tel Aviv (loan) 12 (1)2013–2019 FC Ingolsta...

 

 

Boxing competitions 2011 AIBA World Boxing ChampionshipsVenueHeydar Aliyev Sports and Exhibition ComplexLocationBaku, AzerbaijanStart dateSeptember 22, 2011 (2011-09-22)End dateOctober 10, 2011 (2011-10-10)Competitors685 from 127 nations← Milan 2009Almaty 2013 → 2011 World Amateur Boxing ChampionshipsLight flyweightFlyweightBantamweightLightweightLight welterweightWelterweightMiddleweightLight heavyweightHeavyweightSuper heavy...

Former English school in Woolhampton For the sixteenth-century seminary, see English College, Douai. Douai SchoolLocationUpper Woolhampton, BerkshireEnglandInformationTypePrivateMottoDominus mihi adjutor (Latin: The Lord is my aid)Religious affiliation(s)Roman CatholicEstablished1615 (re-founded 1818 and 1903)FounderSt. Edmund's Monastery (Paris)Closed1999GenderBoysAge13 to 18Number of pupilsapprox. 200HousesFaringdon   ; Gifford   ; Samson   ; Walmesley ...

 

 

County in Texas, United States Not to be confused with Jefferson, Texas. County in TexasJefferson CountyCountyThe Jefferson County Courthouse in Beaumont. The Art Deco-style building was added to the National Register of Historic Places on June 17, 1982. The top five floors once served as the County Jail. SealLocation within the U.S. state of TexasTexas's location within the U.S.Coordinates: 29°52′N 94°08′W / 29.86°N 94.14°W / 29.86; -94.14Country United S...

 

 

Welsh Prince of Powys and Gwynedd Attributed arms of Cadwgan ap Bleddyn Cadwgan ap Bleddyn (1051–1111) was a prince of the Kingdom of Powys (Welsh: Teyrnas Powys) in north eastern Wales.[1] He (possibly born 1060) was the second son of Bleddyn ap Cynfyn[2] who was king of both Kingdom of Powys and Gwynedd.[3] The Anglo-Saxon Chronicle stated: the Welsh ... chose many leaders from among themselves, one of them was called Cadwgan, who was the finest of the all.[4&#...

«Carissimi alanfordissimi...» (Incipit nella rubrica della posta di Max Bunker in appendice agli albi di Alan Ford) Max Bunker negli anni settanta. Max Bunker, pseudonimo di Luciano Secchi (Milano, 24 agosto 1939), è un fumettista, scrittore, editore giornalista, sceneggiatore e regista italiano. È noto per aver creato famosi personaggi come Alan Ford, Maxmagnus, Kriminal e Satanik, sempre in coppia con il disegnatore Magnus, ritenuti dei classici del fumetto italiano e dai quali vennero...

 

 

Jared Polis Jared Schutz Polis (/ˈpoʊlɪs/; lahir 12 Mei 1975) adalah seorang politikus, wirausahawan, dan filantropis Amerika Serikat yang menjabat sebagai Gubernur Colorado ke-43 sejak Januari 2019. Sebagai anggota Partai Demokrat, ia menjalani satu masa jabatan pada Badan Pendidikan Negara Bagian Colorado dari 2001 sampai 2007 dan lima masa jabatan sebagai anggota DPR Amerika Serikat dari 2009 sampai 2019. Ia terpilih menjadi gubernur Colorado pada 2018, mengalahkan nominee Partai Republ...

 

 

Sisi timur Kirribilli House, dilihat dari sebuah feri komuter. Sisi tenggara Kirribilli House, dilihat dari sebuah feri komuter. Sydney Harbour dari udara, memperlihatkan Kirribilli House di ujung kiri. Rumah Kirribilli adalah kediaman resmi Perdana Menteri Australia di Sydney. Rumah ini terletak di ujung timur jauh Kirribilli Avenue di kota pinggiran Kirribilli. Sejarah Tahun 1854, Adolphus Frederic Feez membeli tanah di Kirribilli Point dengan harga 200 pound. Ia membangun rumah bergaya Go...

Sri Lankan politician This biography of a living person needs additional citations for verification. Please help by adding reliable sources. Contentious material about living persons that is unsourced or poorly sourced must be removed immediately from the article and its talk page, especially if potentially libelous.Find sources: Neil Rupasinghe – news · newspapers · books · scholar · JSTOR (August 2011) (Learn how and when to remove this message) Hon....

 

 

Tournoi de tennis de Madrid (ATP 2017) Édition Mutua Madrid Open Date Du 7 au 14 mai 2017 Lieu Caja Mágica Madrid 40° 22′ 08″ N, 3° 41′ 04″ O Catégorie ATP Masters 1000 Surface Terre battue (ext.) Dotation 5 439 350 € Total Financial Commitment 6 408 230 € Simple 6 tours (56 joueurs) Rafael Nadal Double 5 tours (24 équipes) Łukasz Kubot Marcelo Melo Tournoi de tennis de Madrid Édition 2016 Édition 2018 Localisat...