En estadística, la prova de Kruskal-Wallis (de William Kruskal i W. Allen Wallis) és un mètode no paramètric per provar si un grup de dades prové de la mateixa població. Intuïtivament, és idèntic a l'ANOVA amb les dades reemplaçades per categories. És una extensió de la prova de la U de Mann-Whitney per a 3 o més grups.
Ja que és una prova que no és paramètrica, no s'assumeix normalitat en les dades, en oposició a l'ANOVA tradicional. Sí assumeix, sota la hipòtesi nul·la, que les dades venen de la mateixa distribució. Una forma comuna en què es viola aquest supòsit és amb dades heterocedàstiques.
Mètode
- La prova ve donada per: , on:
- és el nombre d'observacions en el grup
- és el rang (entre totes les observacions) de l'observació en el grup
- és el nombre total d'observacions entre tots els grups
- ,
- és la mitjana de .
- Noti que el denominador de l'expressió per és exactament . Seguidament .
- Es pot realitzar una correcció per als valors repetits dividint per , on és el nombre de grups de diferents rangs repetits, i és el nombre d'observacions repetides dins del grup que té observacions repetides per a un determinat valor. Aquesta correcció fa canviar a molt poc fora que hi hagi un gran nombre d'observacions repetides.
- Finalment, el p-value (valor p) és aproximat per . Si algun és petit () la distribució de pot ser diferent de khi-quadrat.
Vegeu també
Referències
Article adaptat de la Wikipedia en anglès.
- William H. Kruskal and W. Allen Wallis. Use of ranks in one-criterion variance analysis. Journal of the American Statistical Association 47 (260): 583–621, December 1952.
- Sidney Siegel and N. John Castellan, Jr. (1988). Nonparametric Statistics for the Behavioral Sciences (second edition). New York: McGraw-Hill.