L'eix horitzontal és l'índex k . La funció només està definida en valors sencers de k . Les línies que connecten els punts són només guies per a l'ull i no indiquen continuïtat.
En teoria de probabilitat i estadística, la distribució de Poisson o llei dels petits nombres o dels fenòmens rars és una distribució de probabilitatdiscreta que és un bon model per molts fenòmens naturals o socials. Una propietat especialment important és que una distribució binomial de paràmetres i , , amb gran i petit es pot aproximar (en distribució) per una distribució de Poisson de paràmetre ; moltes de les aplicacions de la distribució de Poisson es justifiquen en base aquesta propietat.
Aquesta distribució va ser introduïda per Siméon-Denis Poisson l'any 1837 en el seu treball Recherches sur la probabilité des jugements en matière criminelle et en matière civile[1] ( Investigació sobre la probabilitat dels judicis en matèries criminals i civils ).
Les referències bàsiques d'aquesta pàgina són[2][3]
Definició
Una variable aleatòria de Poisson de paràmetre és una variable discreta que pot prendre qualsevol valor natural, 0, 1, 2, ... amb probabilitatsS'escriu o o alguna notació similar.
Propietats
1. Esperança i variància. L'esperança i la variància d'una variable aleatòria amb distribució de Poisson de paràmetre són iguals a :
Així, si la distribució de Poisson s'utilitza per modelar el comptatge d'un fenomen, aleshores es pot interpretar com la freqüència esperada del fenomen.
Prova:on hem utilitzat el desenvolupament es sèrie de la funció exponencial.
Per trobar el moment de segon ordre i la variància calcularem :
D'altra banda, d'onLlavors,
2. Moments d'ordre superior. Els moments d'ordre superior són polinomis de Touchard en , i els coeficients tenen una interpretació combinatòria. De fet, quan el valor esperat de la distribució de Poisson és 1, llavors segons la fórmula de Dobinski, el -èsim moment iguala el nombre de particions de mida .
3. Moda. La moda d'una variable aleatòria de distribució de Poisson amb un no sencer és igual a , el més gran dels enters menors que (els símbols representen la funció part sencera). Quan és un enter positiu, les modes són i .
4. Funció generatriu de moments. La Funció generatriu de la distribució de Poisson de paràmetre és
6. Divergència de Kullback-Leibler. La divergència Kullback-Leibler d'una variable aleatòria de Poisson de paràmetre a una altra de paràmetre és
7. Sumes de variables aleatòries de Poisson. La suma de variables aleatòries de Poisson independents és una altra variable aleatòria de Poisson en què el paràmetre és la suma dels paràmetres de les originals. Dit d'una altra manera, si
són N variables aleatòries de Poisson independents, llavors
.
Relació amb altres distribucions
Distribució binomial
La distribució de Poisson és un cas límit de la distribució binomial: una distribució binomial amb gran, petita, i petita respecte a , es pot aproximar raonablement bé per una distribució de Poisson de paràmetre . Històricament, Poisson va utilitzar aquest argument per introduir la seva distribució,[4] i és el principal raonament per justificar la utilització d'aquesta distribució, tal com veurem en els exemples més avall.
Formalment, sigui una successió de nombres tals que . Considerem una llei binomial de paràmetres i , , i sigui Aleshores
En efecte, tenim que
Llavors, per a on hem utilitzat un límit tipus nombre .
Per a qualsevol natural , tenim, per a prou gran, i passant al límit s'obté Noteu que d'aquí es dedueix que la successió convergeix en distribució a .
En particular, si partim de i prenem aleshores tenim que una distribució binomial amb gran, petita i relativament petita respecte , es pot aproximar per una distribució de Poisson . Aquesta propietat fa que la distribució de Poisson també s'anomeni llei dels petits nombres; [5] o dels fenòmens rars, ja que el fenomen subjacent té probabilitat petita; Johnson and Kotz [3] atribueixen el nom <<llei del petits nombres>> a Bortkiewicz (o Borkiewitsch) (1868-1931) i el seu llibre Das Gesetz der kleinen Zahlen (La llei dels petits nombres). Un autor de pes, Feller,[6] considera desafortunat aquest nom i dona nombrosos exemples per mostrar-ho. Cal tenir present que si bé la probabilitat és petita, el producte pot ser gran, sempre que sigui relativament petit respecte de .
Aproximació normal
A conseqüència de teorema central del límit, per a valors grans de , una variable aleatòria de Poisson es pot aproximar per una variable normal de mitjana i variància ja que Vegeu.[7][8]
Distribució exponencial
Suposem que per a cada valor , que representa el temps, el nombre d'aparicions de cert fenomen aleatori segueix una distribució de Poisson de paràmetre . Llavors, els temps que discorren entre dos aparicions successives segueix la distribució exponencial.
Distribució khi-quadrat
Si és una distribució de Poisson de paràmetre , aleshores [9] per a ,
on és una variable aleatòria amb distribució amb graus de llibertat.
Aquesta fórmula és útil perquè permet calcular el valor de la funció de distribució d'una variable aleatòria de Poisson de manera ràpida.
Exemples històrics
Soldats de l'exèrcit prussià morts per una guitza del seu cavall
En el llibre que hem citat abans de Bortkiewicz, s'estudia el nombre de soldats de l'exèrcit prussià morts per una guitza del seu cavall. A la taula[10] hi ha el nombre de morts corresponent a 10 cossos de característiques similars [11] durant 20 anys
Taula 1. Nombre de soldats morts per una guitza del seu cavall a l'exercit en 10 cossos de l'exercit prussià durant 1875-1894
Cos de l'exercit
Any
II
III
IV
V
VII
VIII
IX
X
XIV
XV
Total
1875
1
1
1
3
1876
1
1
1
3
1877
1
1
2
4
1878
2
1
1
1
1
6
1879
1
1
2
1
1
6
1880
2
1
1
1
2
1
3
11
1881
2
1
1
1
5
1882
1
1
2
4
1
9
1883
1
2
1
1
1
6
1884
1
1
2
1
1
6
1885
2
1
3
1886
1
1
1
3
6
1887
2
1
2
1
1
2
9
1888
1
1
1
3
1889
1
1
1
1
2
2
8
1890
2
1
2
2
1
2
2
12
1891
1
1
1
1
1
3
1
9
1892
2
1
1
1
1
1
7
1893
1
2
1
4
1894
1
1
2
Total
12
12
8
11
12
7
13
15
24
8
122
En total es van produir 122 morts. La següent taula és un resum de la Taula 1 en termes de freqüències absolutes i relatives:
Taula 2. Taula de freqüències de les dades de Bortkiewicz
Nombre de soldats morts en un cos i anys
0
1
2
3
4
Total
Freqüència absoluta
109
65
22
3
1
200
Freqüència relativa
0.545
0,325
0,110
0,015
0,005
1
La mitjana de morts per cos i any és
Suposem que cos de l'exèrcit tenia 1000 soldats (com veurem, aquest nombre, que desconeixem, no té cap paper, podríem posar ). Un model raonable per al nombre de soldats morts (per cos i any) és una distribució binomial, on és la probabilitat que un soldat resulti mort. Aquesta probabilitat és molt petita i podem estimar-la de la següent manera: Tenim 10 cossos durant 10 anys, que representen soldats. Aleshores D'acord amb els comentaris anteriors, podem aproximar la distribució binomial per una distribució de Poisson de paràmetre que és la mitjana que hem calculat abans. La Taula 3 dona les probabilitats d'una variable aleatòria de Poisson de paràmetre , :
Taula 3. Taula de probabilitats d'una distribució de Poisson Poi(0,61)
0
1
2
3
Probabilitat
0.543
0,331
0,101
0,020
0,003
En comparar la fila de les freqüències relatives de la Taula 2 i les probabilitats de la Taula 3 veiem que la concordança entre ambdues és realment notable.
Desintegració de partícules radioactives
Rutherford i Geiger [12] reporten que varen observar el nombre de partícules emeses per una massa de material radioactiu durant 2.608 intervals de 7,5 segons cadascun. A la Taula 4 la denota el nombre de partícules emeses en un interval de 7,5 segons, la freqüència absoluta és el nombre de vegades que es va observar el corresponent valor , després hi ha freqüència relativa i finalment la probabilitat que una variable de Poisson de paràmetre prengui aquell valor:
Taula 4. Experiment de Rutherford et al.
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Total
Freq. absoluta
57
203
383
525
532
408
273
139
45
27
10
4
0
1
1
2608
Freq. relativa
0,022
0,078
0,147
0,201
0,204
0,156
0,105
0,053
0,017
0,010
0.004
0.002
0.000
0,000
0,000
1
Probabilitat Poisson
0,021
0,081
0,156
0,201
0,195
0,151
0,097
0,054
0,026
0,011
0.004
0.002
0.000
0,000
0,000
1
El paràmetre s'ha calculat com la mitjana del nombre de partícules emeses per unitat de temps:
Com veiem la concordança entre les dades observades i les probabilitats corresponents a la distribució de Poisson és molt bona. Breiman [13] argumenta perquè la distribució de Poisson apareix en aquesta situació: Suposem que durant un període llarg, la mitjana de partícules emeses per unitat de temps és (en aquest cas, la unitat de temps seria 7,5 seg). Considerem ara el nombre de partícules emeses durant un interval de temps de longitud unitats; el resultat pot ser 0, 1, 2, etc. Per trobar una assignació raonable de probabilitats dividim l'interval en parts d'amplada ; prenem prou gran perquè els subintervals siguin molt petits; en cada subinterval podem observar 0, 1, 2, ... partícules. Suposem:
1. Les probabilitats d'observar 0, 1, ... partícules són les mateixes per a tots els subintervals.
2. La probabilitat d'observar dos o més partícules en un subinterval és menyspreable comparada amb les probabilitats d'observar-ne zero o una partícula.
3. La probabilitat d'observar o no una partícula en un subinterval
és independent d'observar o no una partícula en un altre subinterval.
El bombardeig de Londres durant la 2a. Guerra Mundial
Durant la Segona Guerra Mundial els alemanys van bombardejar Londres i altres llocs amb bombes volants. Molta gent creia que les bombes tendien a agrupar-se en clústers; amb l'objectiu d'analitzar si aquesta suposició era veritat es va dividir el sud de Londres en 576 quadrats de 0'5 km²; durant el període considerat van caure 537 bombes, vegeu la Figura 1.
La taula 5 [14] mostra el nombre de quadrats on van caure 0 bombes, 1 bomba, etc. (freqüència absoluta), així com la freqüència relativa.
Taula 5. Bombardeig sobre Londres
0
1
2
3
4
Total
Freq. absoluta
229
211
93
35
7
1
576
Freq. relativa
0,397
0,366
0,161
0,061
0,012
0,002
1
Prob. Poisson
0,394
0,367
0,171
0,053
0,012
0,002
1
Freq. esperada Poisson
226,7
211,4
98,5
36,6
7,1
1,3
575,8
La mitjana de bombes per quadrat és
A la taula 5 hi ha una fila amb les probabilitats d'una variable de Poisson de paràmetre per i el valor . També hi ha una fila amb els productesels quals són les freqüències absolutes esperades per una variable de Poisson.
L'ajustament de les dades observades amb les donades per la distribució de Poisson és molt bona, la qual cosa suggereix que no va haver-hi clústers i que el lloc de caiguda de les bombes era completament aleatori. Chung[15] argumenta el bon ajust amb la distribució de Poisson dient que, si el fenomen és purament aleatori, es pot estudiar com un problema de col·locació de 537 objectes en 576 caixes; la probabilitat d'observar exactament bombes (objectes) en un quadrat (una capsa) serà , on és una variable binomial de paràmetres i : . Atès que és gran i petita, podem aproximar per una variable de Poisson de paràmetre que és el que hem fet anteriorment.
Feller [16] també analitza aquestes dades i comenta que <<la taula anterior indica que hi ha aleatorietat i homogeneïtat perfectes, [...] però que per a [l'ull] inexpert, l'aleatorietat apareix com regularitat [...]>>. Per profunditzar en aquest comentari de Feller és molt interessant el capítol 2 del llibre de J. A. Paulos [17]
Més exemples
Si el 2% dels llibres enquadernats en cert taller té enquadernació defectuosa, la probabilitat que 5 de 400 llibres enquadernats en aquest taller tinguin enquadernacions defectuoses es pot calcular usant la distribució de Poisson. En efecte, el nombre de llibres defectuosos es pot modelar per una distribució binomial de paràmetres i , la qual el pot aproximar per una distribució de Poisson de paràmetre que, d'altra banda, és la mitjana de llibres defectuosos. Per tant, la probabilitat desitjada és
Aquest problema també podria resoldre's recorrent a una distribució binomial de paràmetres , i .
La distribució de Poisson s'aplica a diversos fenòmens discrets de la natura (és a dir, aquells fenòmens que ocorren 0, 1, 2, 3, ... vegades durant un període definit de temps o en una àrea determinada) quan la probabilitat d'ocurrència del fenomen és constant en el temps o l'espai. Exemples d'aquests esdeveniments que poden ser modelats per la distribució de Poisson inclouen:
El nombre de cotxes que passen a través d'un cert punt en una ruta (prou distants dels semàfors) durant un període definit de temps.
El nombre d'errors d'ortografia que un comet en escriure una única pàgina.
El nombre de trucades telefòniques en una central telefònica per minut.
El nombre d'animals morts trobats per unitat de longitud de ruta.
El nombre de mutacions de determinada cadena d'ADN després de certa quantitat de radiació.
El nombre de nuclis atòmics inestables que van decaure en un determinat període en una porció de substància radioactiva. La radioactivitat de la substància es debilitarà amb el temps, per tant el temps total de l'interval utilitzat en el model ha de ser significativament menor que la vida mitjana de la substància.
El nombre d'estels en un determinat volum d'espai.
El nombre d'estels fugaços per una unitat de temps.
La distribució de receptors visuals a la retina de l'ull humà.
La inventiva d'un inventor a través de la seva carrera.[18]
↑L. von Bortkiewicz, <<Das Gesetz der Klenen Zahlen>> (1898), citat per Jonhson, N. L. and Kotz, S. <<Univariate Discrete Distributions>>, 2nd edition, Wiley (1992)
↑Feller, W.. Introducción a la teoría de las probabilidades y sus aplicaciones. México: Limusa-Wiley, S. A., p. 169.
↑Feller, W.. Introducción a la Teoría de las Probabilidades y sus aplicaciones. México: Limusa-Wiley, S. A., 1973, p. 253.