Tabla de contingencia

Tabla de contingencia

En estadística las tablas de contingencia se emplean para registrar y analizar la relación entre dos o más variables, habitualmente de naturaleza cualitativa (nominales u ordinales).

Supóngase que se dispone de dos variables, la primera el sexo (hombre o mujer) y la segunda recoge si el individuo es zurdo o diestro. Se ha observado esta pareja de variables en una muestra aleatoria de 100 individuos. Se puede emplear una tabla de contingencia para expresar la relación entre estas dos variables, del siguiente modo:

Diestro Zurdo TOTAL
Hombre 43 9 52
Mujer 44 4 48
TOTAL 87 13 100

Las cifras en la columna de la derecha y en la fila inferior reciben el nombre de frecuencias marginales y la cifra situada en la esquina inferior derecha es el gran total.

La tabla nos permite ver de un vistazo que la proporción de hombres diestros es aproximadamente igual a la proporción de mujeres diestras. Sin embargo, ambas proporciones no son idénticas y la significación estadística de la diferencia entre ellas puede ser evaluada con la prueba χ² de Pearson, supuesto que las cifras de la tabla son una muestra aleatoria de una población. Si la proporción de individuos en cada columna varía entre las diversas filas y viceversa, se dice que existe asociación entre las dos variables. Si no existe asociación se dice que ambas variables son independientes.

El grado de asociación entre dos variables se puede evaluar empleando distintos coeficientes: el más simple es el coeficiente phi que se define por

φ = √(χ2 / N)

donde χ2 se deriva del test de Pearson, y N es el total de observaciones -el gran total-. Φ puede oscilar entre 0 (que indica que no existe asociación entre las variables) e infinito. A diferencia de otras medidas de asociación, el coeficiente Φ de Cramer no está acotado.

Estudio de diferencia de proporciones

Hay situaciones en las que tenemos probabilidades de éxito cercanas al cero o del uno en donde las proporciones pueden ser poco ilustrativas sobre el comportamiento dentro de los grupos. Por ejemplo:

  • Si π1 = 0.01 π2 = 0.001
    d= π1 - π2 = 0.009
  • Si π1 = 0.41 π2 = 0.401
    d= π1 - π2 = 0.009

Vamos a definir el riesgo relativo como r=π1/π2

Para los ejemplos anteriores: r=0.01/0.001 = 10 r=0.41/0.401 = 1.02

En el primer caso el éxito dentro de los grupos es 10 veces mayor que en el otro.

Si X e Y independientes -> π1 = π2 con lo que su riesgo relativo es r=π1/π2 = 1

Ahora bien, ¿cómo estimar r?

r' = p1/p2

En el ejemplo de más arriba:

r' = (43/52) / (44/48) = 0.902 --> la proporción de éxito (diestro) dentro de las mujeres es alrededor de un 10% mayor que dentro del grupo de los hombres.

Véase también


Wikimedia foundation. 2010.

Игры ⚽ Нужно решить контрольную?

Mira otros diccionarios:

  • Tabla pivote — En procesamiento de datos, una tabla dinámica es una herramienta de compresión de datos que se encuentran en los programas de visualización de datos, tales como hojas de cálculo (por ejemplo, en Microsoft Excel, y OpenOffice.org Calc) o de… …   Wikipedia Español

  • Tabla de valores de verdad — Saltar a navegación, búsqueda Una tabla de valores de verdad, o tabla de verdad, es una tabla que despliega el valor de verdad de una proposición compuesta, para cada combinación de valores de verdad que se pueda asignar a sus componentes.[1] Fue …   Wikipedia Español

  • Tabla de verdad — Una tabla de verdad, o tabla de valores de verdad, es una tabla que despliega el valor de verdad de una proposición compuesta, para cada combinación de valores de verdad que se pueda asignar a sus componentes.[1] Fue desarrollada por Charles… …   Wikipedia Español

  • Coeficiente de contingencia — El coeficiente de contingencia C (de Karl Pearson) es una medida de relación estadística. El coeficiente de contingencia de Pearson expresa la intensidad de la relación entre dos (o más) variables nominales u ordinales. Se basa en la comparación… …   Wikipedia Español

  • Tablas de contingencia — En estadística las tablas de contingencia se emplean para registrar y analizar la relación entre dos o más variables, habitualmente de naturaleza cualitativa nominales u ordinales . Supóngase que se dispone de dos variables, la primera el género… …   Enciclopedia Universal

  • Tabulación cruzada — La tabulación cruzada es el proceso de creación de una tabla de contingencia desde la distribución de frecuencias multivariada de las variables estadísticas. Muy utilizada en la investigación de encuestas, la tabulación cruzada (o tabla cruzada,… …   Wikipedia Español

  • SPSS — Statistical Package for the Social Sciences (SPSS) es un programa estadístico informático muy usado en las ciencias sociales y las empresas de investigación de mercado. En la actualidad, la sigla se usa tanto para designar el programa estadístico …   Wikipedia Español

  • Curva ROC — Saltar a navegación, búsqueda Contenido 1 Curva ROC (Receiver Operating Characteristic) 2 Conceptos Básicos 3 El espacio ROC 4 …   Wikipedia Español

  • Análisis de correspondencias — Saltar a navegación, búsqueda En estadística multivariante, el análisis de correspondencias es una técnica descriptiva desarrollada por Jean Paul Benzécri.[1] Suele aplicarse al estudio de tablas de contingencia y es conceptualmente similar al… …   Wikipedia Español

  • Distribución χ² — (ji cuadrado) Función de densidad de probabilidad …   Wikipedia Español

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”