- Valor P
-
En contrastes de hipótesis, en Estadística, el valor P (a veces conocido simplemente como la P, p-valor, o bien directamente en inglés p-value) está definido como la probabilidad de obtener un resultado al menos tan extremo como el que realmente se ha obtenido (valor del estadístico calculado), suponiendo que la hipótesis nula es cierta. Es fundamental tener en cuenta que el p-valor está basado en la asunción de la hipótesis de partida (o hipótesis nula).
Interpretación
Se rechaza la hipótesis nula si el valor P asociado al resultado observado es igual o menor que el nivel de significación establecido, convencionalmente 0,05 ó 0,01, punto que se llama potencia del contraste. Es decir, el p-valor nos muestra la probabilidad de haber obtenido el resultado que hemos obtenido si suponemos que la hipótesis nula es cierta. Si el p-valor es inferior a la potencia del contraste nos indica que lo más probable es que la hipótesis de partida sea falsa. Sin embargo, también es posible que estemos ante una observación atípica, por lo que estaríamos cometiendo el error estadístico de rechazar la hipótesis nula cuando ésta es cierta basándonos en que hemos tenido la mala suerte de encontrar una observación atípica. Este tipo de errores se puede subsanar rebajando el p-valor, un p-valor de 0,05 es usado en investigaciones habituales sociológicas mientras que p-valores de 0,01 se utilizan en investigaciones médicas, en las que cometer un error puede acarrear consecuencias más graves. También se puede tratar de subsanar dicho error aumentando el tamaño de la muestra obtenida, esto reduce la posibilidad de que el dato obtenido sea casualmente raro.
Valor P es un valor de probabilidad por lo que oscila entre 0 y 1. Así, se suele decir que valores altos de valor P NO RECHAZAN la Hipótesis Nula o, dicho de forma correcta, no permiten rechazar la H0. De igual manera, valores bajos de valor P rechazan la H_0. Es importante recalcar que un contraste de hipótesis nula no permite aceptar una hipótesis, simplemente la rechaza o no la rechaza, es decir que la tacha de verosímil (lo que no significa obligatoriamente que sea cierta, simplemente es lo más probable que sea cierta que sea falsa) o inverosímil.
Ejemplo
Supongamos que dos amigos están en un bar y uno le dice a otro que es capaz de distinguir, sin lugar a dudas, un whisky barato de uno caro. Como el otro amigo no lo cree, deciden hacer una prueba. El amigo bravucón dice que acierta qué tipo de whisky está tomando el 90% de las veces, ya que a veces los hielos le distorsionan la cata. Deciden hacerle probar 20 whiskys (en días distintos) y obtienen el resultado de que acertó sobre el contenido del vaso que estaba probando en 14 noches. Dado que nuestro amigo dijo que acertaría el 90% de las veces y sólo acertó el 70% de ellas (14 de 20 noches), ¿podemos creer a nuestro amigo, o nos está engañando? ¿es posible que fallara por mala suerte, pero si le dejamos seguir intentándolo a la larga acertará el 90%? Está claro que si hubiera acertado todas las noches, o 19 de ellas le creeríamos sin lugar a dudas, también si hubiera fallado todas o casi todas le desmentiríamos sin dudar, pero con 14 sobre 20 es algo dudoso. Esto es lo que podemos medir con el p-valor.
Si suponemos que la hipótesis nula es cierta, esto quiere decir que las catas de nuestro amigo se distribuyen según una binomial de parámetro 0,9, esto es, como una moneda que saliera cara el 90% de las veces y cruz el 10%. ¿Cuál es la probabilidad de que una distribución binomial de parámetro 0,9 repetida 20 veces nos de como resultado 14 caras y 6 cruces? Calculando esa probabilidad nos queda P=0,0088. Si a este valor le sumamos la probabilidad de que acierte sólo 13 veces, más la probabilidad de que acierte sólo 12 veces y así hasta la probabilidad de que no acierte ninguna vez, es decir la probabilidad de que acierte 14 o menos veces esto nos da P=0,01125, éste es el p-valor.
¿Qué significa esto? Esto significa que si realmente suponemos que nuestro amigo acierta el 90% de las veces que prueba una copa y ha probado 20 copas, la probabilidad de que acierte 14 o menos copas es del 1,125%. Por tanto, si damos una potencia de contraste usual de 0,05, que significa que aceptamos equivocarnos el 5% de las veces si repitiéramos el experimento, como el p-valor es inferior a la potencia del contraste rechazamos la hipótesis nula, y declaramos que nuestro amigo es un fanfarrón. Estadísticamente, esto lo hacemos porque el resultado observado (14 aciertos de 20 intentos) es muy poco probable si suponemos que acierta el 90% de las veces, por lo tanto asumimos que no era cierta la hipótesis nula.
¿Que hubiera pasado si hubiera acertado las 20 veces? En ese caso el p-valor saldría muy alto, ya que es muy probable que una distribución binomial de parámetro 0,9 repetida 20 veces nos de 20. Por tanto no rechazamos la hipótesis nula, que no es lo mismo que decir que la aceptamos. Es decir, diríamos que es verosímil que acierte el 90% de las veces, es posible que lleve razón, no tenemos evidencias en contra de ello. Es importante decir que no se acepta la hipótesis nula ya que también sería lógico aceptar que acierta el 100% de las veces y, o bien acierta el 90% o bien acierta el 100% pero ambas no pueden ser válidas a la vez.
El valor p, o también llamado p consignado, es la probabilidad de que de la población propuesta por la hipótesis nula, se obtenga la muestra observada o una aún más alejada.
Fuente
- Sterne JAC, Smith GD (2001). «Sifting the evidence — what's wrong with significance tests?». BMJ 322 (7280): pp. 226–231. doi: . PMID 11159626. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pubmed&pubmedid=11159626.
- Schervish MJ (1996). «P Values: What They Are and What They Are Not». The American Statistician 50 (3): pp. 203-206. http://www.jstor.org/sici?sici=0003-1305(199608)50%3A3%3C203%3APVWTAA%3E2.0.CO%3B2-0.
Wikimedia foundation. 2010.