En théorie des probabilités et en statistique, la loi du χ2 non centrée est une loi de probabilité qui généralise la loi du χ². Cette loi apparait lors de tests statistiques, par exemple pour le maximum de vraisemblance.
Motivations
Soit Xi, k variables aléatoires indépendantes de loi normale de moyennes et variances . Alors la variable aléatoire
suit une loi du χ2 non centrée. Elle dépend de deux paramètres : k qui spécifie le nombre de degrés de liberté (c'est-à-dire le nombre de Xi), et λ qui est en lien avec la moyenne des variables Xi par la formule :
est parfois appelé le paramètre de décentralisation. Certaines références définissent λ différemment, comme la moyenne de la somme ci-dessus ou comme sa racine carrée.
Cette loi apparait en statistique multivariée, elle est issue de la loi normale multidimensionnelle. Comme la loi du χ² est le carré de la norme du vecteur aléatoire défini à partir des variables de loi (c'est-à-dire le carré de la distance entre l'origine et un point donné par cette loi), la loi du χ2 non centrée est le carré de la norme d'un vecteur aléatoire de loi . Ici 0k est le vecteur nul de longueur k, et Ik est la matrice unité de taille k.
Définition
La densité de probabilité est donnée par :
où Yq est de loi du χ² à q degrés de liberté.
De cette représentation, la loi du χ2 non centrée est vue comme une loi mélange de loi du . Supposons que la variable J suit une loi de Poisson avec moyenne λ/2, et que la loi conditionnelle de Z sachant J = i est la loi du χ2 à k+2i degrés de liberté. Alors la loi (non conditionnelle) de Z est la loi du χ2 non centrée à k degrés de liberté, et avec paramètre de décentralisation .
D'une autre part, la densité peut être écrite sous la forme
où Iν(z) est la fonction de Bessel modifiée du premier type donnée par
En utilisant la relation entre les fonctions de Bessel et hypergéométrique, la densité peut également être écrite sous la forme[1] :
Siegel (1979) considère plus particulièrement le cas k=0 (0 degré de liberté), dans ce cas la loi est atomique en 0.
Propriétés
Fonction génératrice des moments
La fonction génératrice des moments est donnée par
Moments
Les premiers moments sont :
Les premiers moments centrés sont :
Le n-ième cumulant est
Ainsi
Fonction de répartition
En utilisant encore la relation entre les lois du χ2 centrée et non centrée, la fonction de répartition peut s'écrire sous la forme
où Q(x ; k) est la fonction de répartition de la loi du χ2 à k degrés de liberté donnée par :
- et où γ(k,z) est la fonction gamma incomplète.
La fonction Q de Marcum QM(a,b) peut également être utilisée pour formuler la fonction de répartition[2] :
Approximation
Sankaran[3] propose plusieurs formes approchées de la fonction de répartition. Dans un article précédent[4], il formule l'expression suivante :
où
- est la fonction de répartition de la loi normale,
Cette approximation ainsi que d'autres sont données dans un livre ultérieur[5].
Pour approcher la loi du χ2, le paramètre de décentralisation λ est égal à zéro.
Liens avec d'autres lois
- Si V est de loi du χ², , alors est également de loi du χ2 non centrée : .
- Si , , et V1 et V2 sont indépendantes, alors est de loi de Fisher non centrée : .
- Si , où désigne la loi de Poisson, alors
- Approximation par la loi normale[6] : si , alors en probabilité lorsque ou .
Sankaran (1963) étudie les transformations de la forme . Il analyse le développement des cumulants de z de l'ordre de et montre que les choix suivants de b donnent les résultats raisonnables suivants :
- rend le second cumulant de z approximativement indépendant de λ,
- rend le troisième cumulant de z approximativement indépendant de λ,
- rend le quatrième cumulant de z approximativement indépendant de λ.
De plus, une transformation plus simple, , peut être utilisée comme fonction de stabilisation de variance qui produit une variable aléatoire de moyenne et de variance .
L'utilisation de ces transformations peut être altérée par le fait de considérer les racines carrées de nombres négatifs.
Différentes lois du χ et χ2
Lois |
en fonction de variables de loi normale
|
loi du χ² |
|
loi du χ² non centrée |
|
loi du χ |
|
loi du χ non centrée |
|
Références
- ↑ Muirhead (2005) Theorem 1.3.4
- ↑ Nuttall, Albert H. (1975): Some Integrals Involving the QM Function, IEEE Transactions on Information Theory, 21(1), 95-96, (ISSN 0018-9448)
- ↑ Sankaran, M. (1963). Approximations to the non-central chi-squared distribution Biometrika, 50(1-2), 199–204
- ↑ Sankaran, M. (1959). "On the non-central chi-squared distribution", Biometrika 46, 235–237
- ↑ Johnson et al. (1995) Section 29.8
- ↑ Muirhead (2005) pages 22–24 and problem 1.18.
- Abramowitz, M. and Stegun, I.A. (1972), Handbook of Mathematical Functions, Dover. Section 26.4.25.
- Johnson, N. L., Kotz, S., Balakrishnan, N. (1970), Continuous Univariate Distributions, Volume 2, Wiley. (ISBN 0-471-58494-0)
- Muirhead, R. (2005) Aspects of Multivariate Statistical Theory (2nd Edition). Wiley. (ISBN 0471769851)
- Siegel, A.F. (1979), "The noncentral chi-squared distribution with zero degrees of freedom and testing for uniformity", Biometrika, 66, 381–386