La fonction de densité de probabilité de la loi de von Mises-Fisher pour le vecteur unitaire aléatoire de dimension p aléatoire est donnée par :
où et la constante de normalisation est égale à
où désigne la fonction de Bessel modifiée de première espèce à l'ordre v. Si p = 3, la constante de normalisation se réduit à
Les paramètres et sont appelés respectivement la direction moyenne et le paramètre de concentration. Plus la valeur de est élevée, plus la masse de la loi est concentrée autour de la direction moyenne . La distribution est unimodale pour , et est uniforme sur la sphère pour .
Dans le manuel de Mardia et Jupp[3], la constante de normalisation donnée pour la densité de probabilité de Von Mises-Fisher est apparemment différente de celle donnée ici, soit . Dans ce livre, la constante de normalisation est spécifiée comme suit :
L'explication vient du fait que Mardia et Jupp donnent la densité "par rapport à la loi uniforme", alors que la densité est ici spécifiée de la manière classique, par rapport à la mesure de Lebesgue. La densité (par rapport à la mesure de Lebesgue) de la loi uniforme est l'inverse de la surface de la p–1-sphère, de sorte que la fonction de densité uniforme est donnée par la constante :
Il s'ensuit alors que :
Alors que la valeur de a été dérivée ci-dessus via l'aire de la surface, le même résultat peut être obtenu en fixant dans la formule ci-dessus pour . Cela peut être fait en notant que le développement en série pour divisé par n'a qu'un terme non nul en . (Pour évaluer ce terme, il faut utiliser la convention).
la loi de von Mises-Fisher est obtenue en imposant . En développant
et en utilisant le fait que les deux premiers termes de droite sont fixes, la densité de von Mises-Fisher, est récupéré en recalculant la constante de normalisation en intégrant sur la sphère unité. Si , on obtient la distribution uniforme, de densité .
Plus succinctement, la restriction de toute densité normale multivariée isotrope à l'hypersphère unitaire, donne une densité de Von Mises-Fisher, à normalisation près.
Cette construction peut être généralisée en partant d'une distribution normale avec une matrice de covariance générale, auquel cas en conditionnant sur donne la distribution de Fisher-Bingham.
Une inversion plus précise peut être obtenue en itérant plusieurs fois la méthode de Newton
Erreur standard
Pour N ≥ 25, l'erreur type sphérique estimée de la direction moyenne de l'échantillon peut être calculée comme suit [4]:
où
Il est alors possible d'approximer un intervalle de confiance sphérique à (soit un cône de confiance) sur avec angle semi-vertical :
Par exemple, pour un cône de confiance à 95 %, Et ainsi
Espérance
L'espérance de la loi de Von Mises-Fisher n'est pas sur l'hypersphère unitaire, mais a plutôt une longueur inférieure à un. Cette longueur est donnée par la constante définie supra. Pour une loi de Von Mises-Fisher de direction moyenne et de concentration , l'espérance est :
.
Pour , l'espérance est à l'origine. Pour fini, la longueur de l'espérance, est strictement comprise entre zéro et 1 et est une fonction croissante monotone de .
La moyenne empirique (arithmétique) d'une collection de points sur l'hypersphère unité se comporte de manière similaire, étant proche de l'origine pour les données largement répandues et proches de la sphère pour les données concentrées. En effet, pour la loi de Von Mises-Fisher, l'espérance de l'estimateur du maximum de vraisemblance basée sur un ensemble de points est égale à la moyenne empirique de ces points.
Il faut noter que l'entropie est une fonction de seulement.
La divergence KL entre et est :
Transformation
Les lois de Von Mises-Fisher (VMF) sont fermées sous les transformées linéaires orthogonales. Soit une matrice orthogonale carrée. On suppose et on applique la transformation linéaire inversible : . La transformée inverse est , car l'inverse d'une matrice orthogonale est sa transposée : . Le jacobien de la transformation est , pour lequel la valeur absolue de son déterminant est 1, également à cause de l'orthogonalité. En utilisant ces faits et la forme de la densité VMF, il s'ensuit que :
On peut vérifier que puisque et sont des vecteurs unitaires, puis par l'orthogonalité, et le sont également.
Généralisations
La loi matricielle de von Mises-Fisher (également connue sous le nom de loi matricielle de Langevin[5],[6] ) a la densité
↑Pal, Sengupta, Mitra et Banerjee, « Conjugate Priors and Posterior Inference for the Matrix Langevin Distribution on the Stiefel Manifold », Bayesian Analysis, vol. 15, no 3, , p. 871–908 (ISSN1936-0975, DOI10.1214/19-BA1176, lire en ligne, consulté le )
↑Jupp, « Maximum likelihood estimators for the matrix von Mises-Fisher and Bingham distributions », The Annals of Statistics, vol. 7, no 3, , p. 599–606 (DOI10.1214/aos/1176344681, lire en ligne)
(en) I. Dhillon et S. Sra, Modeling Data using Directional Distributions, University of Texas, Austin, Tech. rep., .
(en) A. Banerjee, I.S. Dhillon, J. Ghosh , J. et S. Sra, « Clustering on the unit hypersphere using von Mises-Fisher distributions », Journal of Machine Learning Research, vol. 6, , p. 1345-1382.