Independència condicional

En teoria de la probabilitat, dos esdeveniments aleatoris i són condicionalment independents donat un tercer esdeveniment precisament si l'ocurrència d' i l'ocurrència de són esdeveniments independents en la seva distribució de probabilitat condicional donada . En altres paraules, i són independents condicionalment donat si i només si, tenint en compte que es produeix, se sap que si es produeix no proporciona informació sobre la probabilitat que es produeixi , i el coneixement de si es produeix no proporciona informació sobre la probabilitat que es produeixi .

El concepte d'independència condicional es pot estendre des d'esdeveniments aleatoris a variables aleatòries i vectors aleatoris.

Independència condicional dels esdeveniments

Definició

En la notació estàndard de la teoria de la probabilitat, i són condicionalment independents si i només si . La independència condicional de i donat es denota com . Formalment:

 

 

 

 

(Eq.1)

o de forma equivalent,

Exemples

La discussió sobre StackExchange proporciona un parell d'exemples útils (vegeu la referència).[1]

Caselles de colors

Cada casella representa un possible resultat. Els esdeveniments , i estan representats per les zones pintades de vermell, blau i groc respectivament. La intersecció entre els esdeveniments i es pinta de porpra.

Les probabilitats d'aquests esdeveniments són zones ombrejades respecte a l'àrea total. En els dos exemples i són condicionalment independents donat perquè:

[Nota 1]

però no són condicionalment independents donat perquè:

Clima i retards

Sigui dos esdeveniments que siguin les probabilitats que les persones i tornin a casa a temps per sopar i el tercer esdeveniment és que una tempesta de neu afecti a la ciutat. Si tant com tinguessin una menor probabilitat d'arribar a casa a temps per sopar, aquestes probabilitats inferiors encara seran independents les unes de les altres. És a dir, el coneixement que arriba tard no indica si arribarà tard (poden viure a diferents barris, recórrer distàncies diferents i utilitzar diferents mitjans de transport). Tanmateix, si es té informació que viuen al mateix barri, utilitzen el mateix transport i treballen al mateix lloc, aleshores els dos esdeveniments NO són condicionalment independents si es veuen afectats per la tempesta de neu.

Suma de daus

La independència condicional depèn de la naturalesa del tercer esdeveniment. Si es llancen dos daus ( i ), es pot suposar que els dos daus es comporten independentment l'un del altre. Si ens fixem en els resultats d'una matriu, no té relació amb l'altra matriu (és a dir, els dos daus són independents). Però si el primer resultat és 3, i algú us explica un tercer esdeveniment (per exemple, que la suma dels dos resultats sigui parell), aquesta informació addicional restringeix les opcions del segon resultat per a un nombre senar. És a dir, els dos esdeveniments poden ser independents, però NO condicionalment independents.

Alçada i vocabulari dels nens

L'alçada i el vocabulari són independents; però no són condicionalment independents si s'afegeix l'edat .

Independència condicional de variables aleatòries

Dues variables aleatòries i són independents condicionals donada una tercera variable aleatòria si i només si són independents en la distribució de probabilitats condicionals que dona . Això és, i són condicionalment independents donat si i només si, donat qualsevol valor de , la distribució de probabilitats de és el mateix per a tots els valors de i la distribució de probabilitats de és el mateix per a tots els valors de. Formalment:

 

 

 

 

(Eq.2)

on és la funció de distribució acumulada condicional de i donat .

Dos esdeveniments i són condicionalment independents donada una σ-àlgebra si

on denota l'esperança condicional de la funció indicatriu de l'esdeveniment , , donada la σ-àlgebra . Això és,

Dues variables aleatòries i són condicionalment independents donada una σ-àlgebra si l'equació anterior es manté per a tots en i en .

Dues variables aleatòries i són condicionalment independents donada una variable aleatòria si són independents, donat : la σ-àlgebra generada per . Això s'escriu comunament:

o

Això es llegeix « és independent de , donat »; el condicionament s'aplica a tota la declaració: «( és independent de ) donat ».

Si assumeix un conjunt de valors comptable, que equival a la independència condicional de i per als esdeveniments de la forma .

La independència condicional de més de dos esdeveniments, o de més de dues variables aleatòries, es defineix de manera analògica.

Els dos exemples següents mostren que ni implica ni està implicada per .

  • Primer, suposem que amb la probabilitat 0,5 i en cas contrari 1. Quan agafa i per ser independents, cadascun té el valor 0 amb la probabilitat 0,99 i el valor 1 en cas contrari. Quan , i tornen a ser independents, però aquesta vegada prenen el valor 1 amb la probabilitat 0,99. Aleshores . Pero i són dependents, perquè . Això és perquè , però si llavors és molt probable que això i així això és també així .
  • Per al segon exemple, suposem que , cadascuna prenent els valors 0 i 1 amb probabilitat 0,5. Fem que sigui el producte . Llavors quan , , però , com és fals.

Consulteu el tutorial de Kevin Murphy on i agafa els valors «mentals» i «esportius».[2]

Independència condicional de vectors aleatoris

Dos vectors aleatoris i són condicionalment independents donat un tercer vector aleatori si i només si són independents en la seva distribució acumulada condicional donada . Formalment:

 

 

 

 

(Eq.3)

on , i i les distribucions acumulatives condicionals es defineixen de la manera següent.

Usos en inferència bayesiana

Sigui p la proporció de votants que votaran «sí» en un proper referèndum. En fer una enquesta d'opinió, es tria n votants a l'atzar entre la població. Per a i = 1, ..., n, fem Xi = 1 o 0 corresponent, respectivament, a si el votant escollit votarà o no votarà «sí».

En un enfocament de freqüència d'inferència estadística, no s'atribuiria cap distribució de probabilitats a p (tret que les probabilitats es poguessin interpretar d'alguna manera com a freqüències relatives d'ocurrència d'algun esdeveniment o com a proporcions d'alguna població) i es diria que X1, ..., Xn són variables aleatòries independents.

Per contra, en un enfocament bayesià d'inferència estadística, es podria assignar una distribució de probabilitats a p independentment de la inexistència d'alguna interpretació d'aquest tipus de «freqüència», i es deuria interpretar les probabilitats com a graus de creença que p es troba en qualsevol interval a que s'assigna una probabilitat. En aquest model, les variables aleatòries X1, ..., Xn no són independents, però són condicionalment independents atès el valor de p. En particular, si s'observa que un gran nombre de X són iguals a 1, això implicaria una alta probabilitat condicional, atès que l'observació, que p és a prop d'1, i per tant una alta probabilitat condicional, donada aquesta observació, que la següent. X a observar serà igual a 1.

Les normes de la independència condicional

De la definició bàsica s'han derivat un conjunt de regles que regulen les declaracions d'independència condicional.[3][4]

  • Nota: ja que aquestes implicacions contenen qualsevol espai de probabilitat, es continuaran mantenint si es considera un subunivers que condiciona tot sobre una altra variable, . Per exemple, també voldria dir això .
  • Nota: a continuació, la coma es pot llegir com una «i».

Simetria

Decomposició

Prova:

  • (significat de )
  • (ignora la variable integrant-la)

Una prova similar mostra la independència de i .

Unió feble

Prova:

  • Per definició, .
  • A causa de la propietat de la descomposició , .
  • Combinant les dues igualitats anteriors dona , que estableix .

La segona condició es pot demostrar de manera semblant.

Contracció

Prova: Aquesta propietat es pot comprovar escrivint , cada igualtat de les quals són afirmades per i , respectivament.

Contracció - unió feble - descomposició

Combinant els tres anteriors, tenim:

Intersecció

Per a les distribucions de probabilitats estrictament positives,[4] també es manté el següent:

Les cinc regles anteriors es van anomenar «Axiomes dels grafoides» de Pearl i Paz, perquè contenen gràfics,[5] si s'interpreta com «Tots els camins de a són interceptats pel conjunt ».[6]

Notes

  1. Per veure que és així, cal adonar-se’n que Pr(RB | Y) és la probabilitat que superposa R i B (la zona ombrejada de pòrpora) a l'àrea Y. Ja que, a la imatge de l'esquerra, hi ha dos quadrats on R i B es solapen dins de l'àrea Y, i l'àrea Y té dotze quadrats, Pr(RB | Y) = 2/12 = 1/6. De manera semblant, Pr(R | Y) = 4/12 = 1/3 i Pr(B | Y) = 6/12 = 1/2

Referències

  1. «Could someone explain conditional independence?» (en anglès).
  2. Murphy, Kevin. «A Brief Introduction to Graphical Models and Bayesian Networks» (en anglès), 1998.
  3. Dawid, A. P. «Conditional Independence in Statistical Theory» (en anglès). Journal of the Royal Statistical Society, Series B, 41(1), 1979, pàg. 1–31. JSTOR: 2984718.
  4. 4,0 4,1 Pearl, J. Causality: Models, Reasoning, and Inference (en anglès). Cambridge University Press, 2000. 
  5. Pearl, Judea; Paz, Azaria. Graphoids: A Graph-Based Logic for Reasoning About Relevance Relations (en anglès), 1985. 
  6. Pearl, Judea. Probabilistic reasoning in intelligent systems: networks of plausible inference (en anglès). Morgan Kaufmann, 1988. 

Vegeu també