In teoria delle probabilità la distribuzione multinomiale è una distribuzione di probabilità discreta che generalizza la distribuzione binomiale in più variabili.
In altri termini, laddove la distribuzione binomiale descrive il numero di successi in un processo di Bernoulli, per il quale ogni singola prova può fornire due soli risultati, la distribuzione multinomiale descrive il caso più generale in cui ogni prova possa fornire un numero finito di risultati, ognuno con la propria probabilità.
Un esempio di distribuzione multinomiale è dato dal numero di occorrenze di ogni faccia per alcuni lanci successivi di un dado a 6 facce.
Definizione
Distribuzione binomiale
La distribuzione binomiale descrive le probabilità per ogni coppia ("successi", "fallimenti") in prove indipendenti, ognuna delle quali ha probabilità e di fornire un "successo" o un "fallimento".
Distribuzione multinomiale
La distribuzione multinomiale di parametri , con , descrive le probabilità per ogni s-upla (con ) di risultati in prove indipendenti, ognuna delle quali ha probabilità di fornire .
Questa distribuzione può essere descritta prendendo un vettore aleatorio per i risultati di ogni singola prova, con
- ,
dove è la base canonica per , ,... ,. La distribuzione multinomiale descrive allora la variabile aleatoria .
Probabilità
La funzione di probabilità della distribuzione multinomiale di parametri , con , è
- per tutte le s-uple con .
Qui il coefficiente multinomiale "conta" il numero di possibili sequenze con risultati , risultati e così via. Il prodotto fornisce la probabilità di ognuna di queste sequenze.
Il teorema multinomiale mostra come la probabilità totale sia pari a 1:
- .
Caratteristiche
Caso binomiale
La distribuzione binomiale di parametri è una distribuzione multinomiale di parametri .
Se il vettore aleatorio segue la distribuzione multinomiale di parametri allora ogni sua coordinata è una variabile aleatoria che segue la distribuzione binomiale . In altri termini ogni coordinata considera i "successi" dell'evento .
Indici
Molte degli usuali indici di una distribuzione su non si estendono al caso multidimensionale.
La speranza matematica del vettore aleatorio (definita come somma pesata dei possibili vettori) per trasformazione lineare ha come componenti le speranze delle componenti ed è pari a volte la speranza di una singola prova:
- .
Come nel caso binomiale la matrice delle covarianze di (la matrice con elementi ) è pari a volte la matrice delle covarianze di una singola prova , dunque è data da
- se .
Distribuzioni correlate
Nella statistica bayesiana la distribuzione di Dirichlet è una coniugata della distribuzione multinomiale. Più precisamente, se il parametro di una distribuzione multinomiale segue una distribuzione di Dirichlet di parametro allora la sua distribuzione condizionata dall'evento segue ancora una distribuzione di Dirichlet, di parametro .
(La distribuzione di Dirichlet è la generalizzazione multivariata della distribuzione Beta, che svolge lo stesso ruolo per la distribuzione binomiale.)
Il test del di adeguamento può essere descritto a partire dalla distribuzione multinomiale, poiché per valori "grandi" di la distribuzione di ogni componente (centrata e ridotta) viene approssimata da una distribuzione normale (standard).
Esempio
Il numero di risultati "1", "2", "3", "4", "5" e "6" per n lanci di un dado equilibrato a 6 facce è descritto dalla distribuzione multinomiale di parametri .
Un diverso esempio è dato dall'estrazione (con reinserimento) di una pallina da un'urna che contenga palline di diversi colori. Per un'urna con sei palline, di cui una verde, due bianche e tre blu, si hanno i parametri ; il risultato di cinque estrazioni (con reinserimento della pallina estratta) è descritto dalla distribuzione multinomiale di parametri .
Per calcolare la probabilità che la pallina estratta sia due volte verde, una volta bianca e due volte blu basta calcolare la probabilità
Collegamenti esterni