- Prueba de Kruskal-Wallis
-
Prueba de Kruskal-Wallis
En estadística, la prueba de Kruskal-Wallis (de William Kruskal y W. Allen Wallis) es un método no paramétrico para probar si un grupo de datos proviene de la misma población. Intuitivamente, es idéntico al ANOVA con los datos reemplazados por categorías. Es una extensión de la prueba de la U de Mann-Whitney para 3 o más grupos.
Ya que es una prueba no paramétrica, la prueba de Kruskal-Wallis no asume normalidad en los datos, en oposición al tradicional ANOVA. Si asume bajo la hipótesis nula que los datos vienen de la misma distribución. Una forma común en que se viola este supuesto es con datos heterocedásticos.
Método
- Ordenar todos los datos de la muestra de menor a mayor, y asignar al menor un rango de 1, al segundo un 2, y así hasta el n-ésimo. Si existen datos que se repiten, se asigna el rango promedio a cada uno de ellos (si existen cuatro datos idénticos que ocupan los rangos 11, 12, 13 y 14, se les asigna un rango de 12,5 a los cuatro).
- El estadístico está dado por: , donde:
- ng es el número de observaciones en el grupo g
- rij es el rango (entre todas las observaciones) de la observación j en el grupo i
- N es el número total de observaciones entre todos los grupos
- ,
- es el promedio de rij.
- Note que el denominador de la expresión para K es exactamente . Luego .
- Se puede realizar una corrección para los valores repetidos dividiendo K por , donde G es el número de grupos de diferentes rangos repetidos, y ti es el número de observaciones repetidas dentro del grupo i que tiene observaciones repetidas para un determinado valor. Esta corrección hace cambiar a K muy poco al menos que existan un gran número de observaciones repetidas.
- Finalmente, el p-value es aproximado por . Si algún ni es pequeño ( < 5) la distribución de K puede ser distinta de la chi-cuadrado.
Véase también
- Prueba de Mann-Whitney
Referencias
Artículo adaptado de la Wikipedia en inglés.
- William H. Kruskal and W. Allen Wallis. Use of ranks in one-criterion variance analysis. Journal of the American Statistical Association 47 (260): 583–621, December 1952.
- Sidney Siegel and N. John Castellan, Jr. (1988). Nonparametric Statistics for the Behavioral Sciences (second edition). New York: McGraw-Hill.
Categorías: Contraste de hipótesis | Análisis de la varianza | Estadística no paramétrica
Wikimedia foundation. 2010.