La modélisation directe de la vraisemblance présente de nombreux avantages comme l'entrainement du réseau par maximum de vraisemblance. De plus, de nouveaux échantillons peuvent être produits en échantillonnant à partir de la distribution initiale et en appliquant la transformation induite par le flot.
Méthodologie
Soit une variable aléatoire et sa densité de probabilité. Pour on construit la suite de variables aléatoires à partir de . Les fonctions sont des difféomorphismes, i.e. des bijections différentiables. La densité obtenue sert à modéliser la distribution empirique des données à décrire, et elle est donnée par la formule de changement de variable:
Les fonctions sont modélisées à travers des réseaux de neurones profonds et sont entrainées pour maximiser la log-vraisemblance. Par conséquent, le calcul de la densité doit être efficace. Ceci nécessite d'employer des fonctions facilement inversible disposant de déterminant jacobien simple à calculer.
Références
↑Tabak et Vanden-Eijnden, « Density estimation by dual ascent of the log-likelihood », Communications in Mathematical Sciences, vol. 8, no 1, , p. 217–233 (DOI10.4310/CMS.2010.v8.n1.a11, lire en ligne)
↑Papamakarios, Nalisnick, Jimenez Rezende et Mohamed, « Normalizing flows for probabilistic modeling and inference », Journal of Machine Learning Research, vol. 22, no 1, , p. 2617–2680 (arXiv1912.02762, lire en ligne)