Bayesen teorema

Bayesen teoremaren formula

Probabilitate teorian[1], Bayesen teorema Thomas Bayes (1702-1761)[2] matematikari ingelesak planteatutako proposizio bat da. Bayesen teoremak garrantzi handia du, ondorioa ezagututa kausa baten probabilitatea lor daitekeelako haren bitartez.

Oro har, Bayesen teoremak, B gertakizuna jasota, A gertakizuna gertatzeko baldintzapeko probabilitatea (a posteriori probabilitatea) adierazten du. Eta hori egiten du A gertakizuna emanda B gertatzeko baldintzapeko probabilitate-banaketaren arabera eta A eta B gertaeren probabilitate marjinalen arabera. Hau matematikoki horrela adierazten da:

Adibidez, gripea izanez gero buruko mina izateko probabilitatea jakinda, Bayesen teoremak buruko mina izanez gero, gripea izateko probabilitatea kalkulatzen du.[3]

Bayesen teoremaren aplikazioen artean, inferentzia bayesiarra [4]dago, inferentzia estatistikoaren adarra dena. Laginean datu berriak agertu ahala, hipotesi baten probabilitatea eguneratzeko erabiltzen den metodo estatistikoa da. Bayesen teoreman oinarritzen da: aurretiazko ezagutza eta datu berriak uztartzen ditu aurreikuspen zehatzagoak egiteko.

Historia

Thomas Bayes (1702 - 1761)

Bayesen teoremak Thomas Bayes (1702-1761) matematikari, estatistikari eta filosofo ingelesaren izena darama. Matematikari honek banaketa binomial baten probabilitatea nola kalkulatu aztertu zuen. Bayesen heriotzaren ostean, hark idatzitako dokumentuak senideek bildu zituzten eta haren laguna zen Richard Price matematikari, filosofo eta ministroari besterendu zizkioten.

Bi urtez, Richard Pricek berrikusi eta modu esanguratsuan editatu zuen Bayesek argitaratu gabe utzi zuen eskuizkribua. 1763ko abenduaren 23an Royal Society elkarte zientifikoak antolatutako hitzaldi batean, Pricen lagun batek eskuizkribua irakurri zuen. Urte horretan, Bayesen lan nagusia argitaratu zen,  An Essay Towards Solving a Problem in the Doctrine of Chances[5] izenekoa, Philosophical Transactions aldizkari barruan. 1765ean, Richard Price Royal Society[6] elkarteko kide aukeratu zuten, Bayesen teoremaren argitalpenean egindako lanagatik.  

Bayesek planteatutako teoremaz aparte,  Pierre-Simon Laplace matematikariak Théorie analytique des probabilités[7] izeneko lanean, baldintzapeko probabilitatea kontzeptua erabili zuen halaber. Laplacek, aurretiazko probabilitate batetik abiatuta, probabilitate eguneratu baten arteko erlazioa azaldu zuen, ebidentzian oinarrituta. Era berean, Laplacek hainbat hamarkadatan zehar Bayesen emaitzetan sakondu zuen, haren lanaren berri izan gabe.

1973. urtean, Sir Harol Jeffreysek[8] Bayesen teoremaren garrantzia azpimarratu zuen; izan ere, probabilitate arloan, Bayesen algoritmoa eta Laplaceren formula konparatu zituen geometriako Pitagorasen teoremarekin.

Teorema

Enuntziatua:

Izan bedi ondoko gertaera-sistema osoa, gertaera bakoitzaren probabilitatea ez-nulua izanik: gertaeren multzo finitu edo infinitu zenbagarri bat, non gertaerak binaka disjuntuak diren eta bildura osoa gertaera segurua dena; hau da,

  1. , guztietarako.
  2. , guztietarako.

Izan bedi, halaber, probabilitate ez-nulua duen gertaera bat, . Orduan,

da, non

  • probabilitate marjinalak edo gertaera bakoitzaren probabilitatea den.
  •  baldintzapeko probabilitatea den: emanda gertatzeko a posteriori probabilitatea.
  • ere baldintzapeko probabilitatea den: emanda gertatzeko a posteriori probabilitatea.

Frogapena:

Bayesen teorema baldintzapeko probabilitatearen[9] definiziotik lor daiteke:

, izanik,

non eta gertaerak aldi berean gertatzeko probabilitatea den. Era berean

da, izanik.

Bigarren ekuazioan bakanduz eta lehen ekuazioan ordezkatuz, Bayesen Teoremaren formula lortzen da:

non .

Adibideak

1) Jokoetarako matematika

Monty Hall-en paradoxa

Bayes-en erregelak eta baldintzapeko probabilitateak igarkizun famatu batzuen soluzioa lortzeko metodoa ematen dute; adibidez:  

2) Droga testak

Marihuana-ren kontsumoa detektatzeko test bat egiten denean, nahiko test fidagarria izan ohi da. Testa ez da perfektua, ordea: orain arte jasotako datuen arabera, droga kontsumitu duen pertsona baten kasuan, testak baiezkoa emateko probabilitatea % 90 da, hau da, benetako positiboen ratioa (BPR)=0.90. Pertsonak kontsumitu ez badu, berriz, frogak ezezkoa emateko probabilitatea % 80 da, hau da, benetako negatiboen ratioa (BNR)=0.80. Gainera, hortaz, kontsumitu ez dutenen artean, %20-ko positibo faltsuak agertuko dira, eta gezurrezko positiboen ratioa (GPR)=0.2.

Suposatuz helduen % 5ek marihuana kontsumitzen dutela, hots, benetako kontsumoa (BK)=0.05 dela, zein da, zoriz pertsona bat hartuz gero, testak positiboa ematen badu, benetan marihuana kontsumitzeko probabilitatea?  

Test baten benetako positiboen proportzioa (BPP), emaitza positibo guztien artean, honela kalkulatu daiteke:

BPP = Benetako positiboak / Positibo guztiak

Lehen definitutako benetako positiboen ratioa (BPR), benetako negatiboen ratioa (BNR) eta benetako kontsumoa (BK) ezagunak badira, BPP-a kalkulatzeko Bayes-en teorema erabili daiteke. Izan bedi P(Kontsumitzailea | Positiboa), kontsumitzailea izateko probabilitatea, jakinda testaren emaitza positiboa izan dela; BPP ere deitu duguna. Teorema erabiliz:

izendatzailea, probabilitate osoaren teoremaren aplikazio zuzena da. Hau beteko da kontsumitzaileek eta ez-kontsumitzaileek multzo baten partiketa disjuntua osatzen dutelako: testa hartzen duten pertsonen multzoaren partiketa, hain zuzen ere. Honi esker eta baldintzapeko probabilitateari esker, aurreko adierazpena lortzen dugu.

Beste era batean esanda, nahiz eta pertsona baten testaren emaitza positiboa izan, benetan kontsumitzailea izateko probabilitatea % 19 da. Hau gertatuko da, multzo honetan soilik % 5 delako kontsumitzailea, eta positibo gehienak gainerako % 95eko positibo faltsuak direlako.

1000 laguneko lagin bat hartuta:

  • 950 ez-kontsumitzaileak dira, eta 190 positibo faltsuak (0.20*950)
  • 50 kontsumitzaileak dira, eta 45 benetako positiboak dira (0.90*50)

Horrenbestez, 1000 pertsonatatik, 235 test positibo lortzen dira, zeinetatik 45 soilik kotsumitzaileak diren, hau da, % 19 inguru.

3) Ontzien eta bolen adibidea

Demagun bi loteria-ontzi ditugula:

1. ontzia: 3 bola gorriz eta 2 bola urdinez osatuta dago

2. ontzia: 1 bola gorriz eta 4 bola urdinez osatuta dago.

Bola gorria atera duzula jakinda, zein da lehenengo ontziko bola izateko probabilitatea?

  1. Gertakizunak definitzen ditugu:
    • : Bola gorri bat ateratzea.
    • : 1. Ontzia aukeratzea.
    • : 2. Ontzia  aukeratzea.
  2. Probabiliteateak:
    • (ontzia ausaz aukeratzen dugulako)
    • (1. ontzian 5 bola daude guztira, horietatik 3 gorriak dira)
    • (2. ontzian 5 bola daude guztira, horietatik 1 gorria da)
  3. kalkulatu Probabilitate Osoaren Teorema erabiliz:
  4. . Bayesen Teorema aplikatu lortzeko (1.ontzia izateko probabilitatea bola gorria atera dugula jakinda):


Lortutako emaitzaren azalpena:

Jakinda bola gorria atera dugula, aukeratutako ontzia lehenengoa izateko probabilitatea 0.75 izango da (% 75eko probabilitatea). Horrek esan nahi du, bola gorri bat atera dugula behatzen badugu, bola hori lehenengo ontzikoa izateko probabilitate handia dagoela.

Erreferenziak

  1. Probabilitate teoria. .
  2. Bayes, Thomas. Encyclopedia of Mathematics. .
  3. Ioannidis, J. P. A. (2005). Why Most Published Research Findings Are False. PLoS Medicine, 2(8), e124.
  4. Bayesian Data Analysis. CRC Press.
  5. [https://probabilityandfinance.com/pulskamp/Bayes/bayesessay-rjp.pdf LII. An Essay towards solving a Problem in the Doctrine of Chances. By the late Rev. Mr. Bayes, communicated by Mr. Price, in a letter to John Canton, M. A. and F. R. S.. ].
  6. LII. An essay towards solving a problem in the doctrine of chances. By the late Rev. Mr. Bayes, F. R. S. communicated by Mr. Price, in a letter to John Canton, A. M. F. R. S. .
  7. Laplace, Pierre-Simon. THE ANALYTIC THEORY OF PROBABILITIES Third Edition Book I. .
  8. Sir Harold Jeffreys, 2 April 1891 - 18 March 1989. .
  9. Cain, Jerry. Conditional Probability and Bayes. .

Bibliografia gehigarria

  1. DeGroot, M. H., & Schervish, M. J. (2002). Probability and Statistics. Addison-Wesley.

Kanpo estekak