Prueba U de Mann-Whitney

Prueba U de Mann-Whitney

En estadística la prueba U de Mann-Whitney (también llamada de Mann-Whitney-Wilcoxon, prueba de suma de rangos Wilcoxon, o prueba de Wilcoxon-Mann-Whitney) es una prueba no paramétrica aplicada a dos muestras independientes. Es, de hecho, la versión no paramétrica de la habitual prueba t de Student.

Fue propuesto inicialmente en 1945 por Frank Wilcoxon para muestras de igual tamaños y extendido a muestras de tamaño arbitrario como en otros sentidos por Henry B. Mann y D. R. Whitney en 1947.

Contenido

Planteamiento de la prueba

La prueba de Mann-Whitney se usa para comprobar la heterogeneidad de dos muestras ordinales. El planteamiento de partida es:

  1. Las observaciones de ambos grupos son independientes
  2. Las observaciones son variables ordinales o continuas.
  3. Bajo la hipótesis nula, las distribuciones de partida de ambas distribuciones es la misma
  4. Bajo la hipótesis alternativa, los valores de una de las muestras tienden a exceder a los de la otra: P(X > Y) + 0.5 P(X = Y)  > 0.5.

Cálculo del estadístico

Para calcular el estadístico U se asigna a cada uno de los valores de las dos muestras su rango para construir

U_1=R_1 - {n_1(n_1+1) \over 2}
U_2=R_2 - {n_2(n_2+1) \over 2}

donde n1 y n2 son los tamaños respectivos de cada muestra; R1 y R2 es la suma de los rangos de las observaciones de las muestras 1 y 2 respectivamente.

El estadístico U se define como el mínimo de U1 y U2.

Los cálculos tienen que tener en cuenta la presencia de observaciones idénticas a la hora de ordenarlas. No obstante, si su número es pequeño, se puede ignorar esa circunstancia.

Distribución del estadístico

La prueba calcula el llamado estadístico U, cuya distribución para muestras con más de 20 observaciones se aproxima bastante bien a la distribución normal.

La aproximación a la normal, z, cuando tenemos muestras lo suficientemente grandes viene dada por la expresión:

z = (UmU) / σU

Donde mU y σU son la media y la desviación estándar de U si la hipótesis nula es cierta, y vienen dadas por las siguientes fórmulas:

mU = n1n2 / 2.
\sigma_U=\sqrt{n_1 n_2 (n_1+n_2+1) \over 12}.

Implementaciones

  • Implementación en línea usando javascript
  • R tiene una implementación del test (al que se refiere como el Wilcoxon two-sample test) mediante wilcox.test (y para el caso de datos pareados, wilcox.exact en el paquete exactRankTests o con la opción exact=FALSE).

Véase también


Wikimedia foundation. 2010.

Игры ⚽ Поможем сделать НИР

Mira otros diccionarios:

  • Prueba de Kruskal-Wallis — Saltar a navegación, búsqueda En estadística, la prueba de Kruskal Wallis (de William Kruskal y W. Allen Wallis) es un método no paramétrico para probar si un grupo de datos proviene de la misma población. Intuitivamente, es idéntico al ANOVA con …   Wikipedia Español

  • Ranking — El texto que sigue es una traducción defectuosa o incompleta. Si quieres colaborar con Wikipedia, busca el artículo original y mejora o finaliza esta traducción. Puedes dar aviso al autor principal del artículo pegando el siguiente código en su… …   Wikipedia Español

  • Estadística no paramétrica — Saltar a navegación, búsqueda La estadística no paramétrica es una rama de la estadística que estudia las pruebas y modelos estadísticos cuya distribución subyacente no se ajusta a los llamados criterios paramétricos. Su distribución no puede ser …   Wikipedia Español

  • Contraste de hipótesis — Dentro de la inferencia estadística, un contraste de hipótesis (también denominado test de hipótesis o prueba de significación) es un procedimiento para juzgar si una propiedad que se supone cumple una población estadística es compatible con lo… …   Wikipedia Español

  • Curva ROC — Saltar a navegación, búsqueda Contenido 1 Curva ROC (Receiver Operating Characteristic) 2 Conceptos Básicos 3 El espacio ROC 4 …   Wikipedia Español

  • Estadística — Saltar a navegación, búsqueda Para análisis, datos y gráficas sobre Wikipedia, véase Wikipedia:Estadísticas. La estadística es una ciencia con base matemática referente a la recolección, análisis e interpretación de datos, que busca explicar… …   Wikipedia Español

  • Escalas Likert — Saltar a navegación, búsqueda La escala de tipo Likert es una escala psicométrica comúnmente utilizada en cuestionarios, y es la escala de uso más amplio en encuestas para la investigación. Cuando respondemos a un elemento de un cuestionario… …   Wikipedia Español

  • Distribución normal — Saltar a navegación, búsqueda Distribución normal Función de densidad de probabilidad La línea verde corresponde a la distribución normal estandar Función de distribución de probabilidad …   Wikipedia Español

  • SingStar Pop — Desarrolladora(s) London Studio, SCEE Distribuidora(s) Sony Computer Entertainment Diseñador(es) London Studio Última versión …   Wikipedia Español

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”