Prova de Kruskal-Wallis

En estadística, la prova de Kruskal-Wallis (de William Kruskal i W. Allen Wallis) és un mètode no paramètric per provar si un grup de dades prové de la mateixa població. Intuïtivament, és idèntic a l'ANOVA amb les dades reemplaçades per categories. És una extensió de la prova de la U de Mann-Whitney per a 3 o més grups.

Ja que és una prova que no és paramètrica, no s'assumeix normalitat en les dades, en oposició a l'ANOVA tradicional. Sí assumeix, sota la hipòtesi nul·la, que les dades venen de la mateixa distribució. Una forma comuna en què es viola aquest supòsit és amb dades heterocedàstiques.

Mètode

  1. La prova ve donada per: , on:
    • és el nombre d'observacions en el grup
    • és el rang (entre totes les observacions) de l'observació en el grup
    • és el nombre total d'observacions entre tots els grups
    • ,
    • és la mitjana de .
      Noti que el denominador de l'expressió per és exactament . Seguidament .
  2. Es pot realitzar una correcció per als valors repetits dividint per , on és el nombre de grups de diferents rangs repetits, i és el nombre d'observacions repetides dins del grup que té observacions repetides per a un determinat valor. Aquesta correcció fa canviar a molt poc fora que hi hagi un gran nombre d'observacions repetides.
  3. Finalment, el p-value (valor p) és aproximat per . Si algun és petit () la distribució de pot ser diferent de khi-quadrat.

Vegeu també

Referències

Article adaptat de la Wikipedia en anglès.

  • William H. Kruskal and W. Allen Wallis. Use of ranks in one-criterion variance analysis. Journal of the American Statistical Association 47 (260): 583–621, December 1952.
  • Sidney Siegel and N. John Castellan, Jr. (1988). Nonparametric Statistics for the Behavioral Sciences (second edition). New York: McGraw-Hill.