En statistiques, les données de composition, ou données compositionnelles, sont des données relatives décrivant des parties d'un ensemble, sous forme de pourcentage ou de proportions. Mathématiquement, les données compositionnelles appartiennent au simplexe.
Espace des données de composition
En 1982, John Aitchison définit les données compositionnelles comme étant des proportions d'un ensemble[1]. En particulier, une composition peut être représentée par un vecteur à composantes positives, dont la somme vaut le plus souvent 1.
L'espace des données de composition est un simplexe:
où D est le nombre de parts (ou de composants). Puisque la seule information est le ratio entre les composants, l'information d'une composition est préservée par la multiplication par une constante positive. Ainsi, le simplexe peut toujours être considéré comme étant un simplexe standard, avec .
Références
↑John Aitchison, « The Statistical Analysis of Compositional Data », Journal of the Royal Statistical Society. Series B (Methodological), vol. 44, no 2, , p. 139–177 (DOI10.1111/j.2517-6161.1982.tb01195.x)