Análisis de la covarianza

Análisis de la covarianza

El análisis de la covarianza o ANCOVA, acrónimo del inglés analysis of covariance, es un modelo lineal general con una variable cuantitativa y uno o más factores. El ANCOVA es una fusión del ANOVA y de la regresión lineal múltiple. Es un procedimiento estadístico que permite eliminar la heterogeneidad causada en la variable de interés (variable dependiente) por la influencia de una o más variables cuantitativas (covariables). Básicamente, el fundamento del ANCOVA es un ANOVA al que a la variable dependiente se le ha eliminado el efecto predicho por una o más covariables por regresión lineal múltiple. La inclusión de covariables puede aumentar la potencia estadística porque a menudo reduce la variabilidad.

Contenido

Ecuaciones

ANCOVA de un factor

El análisis de un factor es apropiado cuando se dispone de tres o más grupos; k grupos. El factor (variable categórica) tiene k niveles. En los diseños equilibrados, cada grupo tiene el mismo número de datos (individuos), los cuales idealmente han sido asignados al azar a cada grupo a partir de una muestra original preferiblemente homogénea.

Calculando la suma de las desviaciones al cuadrado para la variable independiente X y la variable dependiente Y

La suma de las desviaciones al cuadrado (SS): SSTy, SSTry, y SSEy debe ser calculada usando las siguientes ecuaciones para la variable dependiente, Y. La SS para la covariable también debe ser calculada; los dos valores necesarios son SSTx y SSEx.

La suma de cuadrados total define una la variabilidad del total de individuos nT:

SST_y=\sum_{i=1}^n\sum_{j=1}^kY_{ij}^2-\frac{\left(\sum_{i=1}^n\sum_{j=1}^kY_{ij}\right)^2}{n_T}

La suma de cuadrados para los tratamientos define la variabilidad entre las poblaciones o grupos. nk representa el número de grupos.

SSTr_y=\sum_{i=1}^n\left(\frac{\sum_{j=1}^kY_{ij}^2}{n_k}\right)-\frac{\left(\sum_{i=1}^n\sum_{j=1}^kY_{ij}\right)^2}{n_T}

La suma de cuadrados del error define la variabilidad residual dentro de cada grupo. nn representa el número de individuos en un grupo dado:

SSE_y=\sum_{i=1}^n\sum_{j=1}^kY_{ij}^2-\sum_{i=1}^n\left(\frac{\sum_{j=1}^kY_{ij}^2}{n_k}\right)

La suma de cuadrados total es igual a la suma de cuadrados de los tratamientos y la suma de cuadrados del error (propiedad de aditividad de las sumas de cuadrados y de los grados de libertad, característica del ANOVA).

SST_y=SSTr_y+SSE_y.\,

Cálculo de la covarianza de X e Y

La suma de las covarianzas define la covarianza de X e Y.

SCT=\sum_{i=1}^n\sum_{j=1}^kX_{ij}Y_{ij}-\frac{\left(\sum_{i=1}^n\sum_{j=1}^kX_{ij}\right)\left(\sum_{i=1}^n\sum_{j=1}^kY_{ij}\right)}{n_T}
SCE=\sum_{j=1}^k\left(\sum_{i=1}^nX_{ij}Y_{ij}-\frac{\sum_{i=1}^n(X_{ij}Y_{ij})}{n_n}\right)

Ajuste de SSTy

La correlación entre X e Y es r_T^2.

r_T^2=\frac{SCT^2}{SST_xSST_y}
r_n^2=\frac{SCE^2}{SSE_xSSE_y}

La proporción de covarianza es sustraída de la dependiente; valores de SSy:

SST_{yadj}=SST_y-r_T^2\,
SSE_{yadj}=SSE_y-r_n^2\,
SSTr_{yadj}=SST_{yadj}-SSE_{yadj}\,

Ajuste de las medias de cada grupo k

La media de cada grupo es ajustada del siguiente modo:

M_{y_iadj}=M_{y_i}-\frac{SCE_y}{SCE_x}(M_{x_i}-M_{x_T})

Análisis usando los valores de la suma de cuadrados

Finalmente obtenemos la varianza de los tratamientos libre de la covarianza, donde dfTr (grados de libertad) es igual a NTk − 1. Puede apreciarse que cada covariable elimina un grado de libertad.

MSTr=\frac{SSTr}{df_{Tr}}
MSE=\frac{SSE}{df_E}

El estadístico F es

F_{df_E,df_\mathrm{Tr}}=\frac{\mathrm{MSTr}}{\mathrm{MSE}}.

Enlaces externos (en inglés)


Wikimedia foundation. 2010.

Игры ⚽ Нужно сделать НИР?

Mira otros diccionarios:

  • Covarianza — El análisis de la covarianza es una técnica estadística que, utilizando un modelo de regresión lineal múltiple, busca comparar los resultados obtenidos en diferentes grupos de una variable cuantitativa pero corrigiendo las posibles diferencias… …   Enciclopedia Universal

  • Análisis de componentes principales — Saltar a navegación, búsqueda En estadística, el análisis de componentes principales (en español ACP, en inglés, PCA) es una técnica utilizada para reducir la dimensionalidad de un conjunto de datos. Intuitivamente la técnica sirve para… …   Wikipedia Español

  • Análisis de la correlación canónica — Saltar a navegación, búsqueda El análisis de correlación canónica es un método de análisis multivariante desarrollado por Harold Hotelling. Su objetivo es buscar las relaciones que pueda haber entre dos grupos de variables y la validez de las… …   Wikipedia Español

  • Análisis de la varianza — En estadística, el análisis de la varianza (ANOVA, ANalysis Of VAriance, según terminología inglesa) es una colección de modelos estadísticos y sus procedimientos asociados, en el cual la varianza está particionada en ciertos componentes debidos… …   Wikipedia Español

  • Matriz de covarianza — En estadística y teoría de la probabilidad, la matriz de covarianza es una matriz que contiene la covarianza entre los elementos de un vector. Es la generalización natural a dimensiones superiores del concepto de varianza de una variable… …   Wikipedia Español

  • MANCOVA — En estadística, MANCOVA (del inglés multivariate analysis of covariance), es una extensión del análisis de la covarianza a situaciones en las que hay más de una variable dependiente. Véase también Análisis discriminante ANCOVA MANOVA Categoría:… …   Wikipedia Español

  • Interpretación de Bohm — La interpretación de Bohm (también llamada teoría de la onda piloto o interpretación causal) es una interpretación de la teoría cuántica postulada por David Bohm en 1952 como una extensión de la onda guía de Louis de Broglie de 1927.… …   Wikipedia Español

  • Varianza — En teoría de probabilidad, la varianza (que suele representarse como σ2) de una variable aleatoria es una medida de su dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media. Está medida en… …   Wikipedia Español

  • Vector propio y valor propio — Fig. 1. En esta transformación de la Mona Lisa, la imagen se ha deformado de tal forma que su eje vertical no ha cambiado. (nota: se han recortado las esquinas en la imagen de la derecha) …   Wikipedia Español

  • Propagación de errores — Saltar a navegación, búsqueda En Estadística, la propagacion de errores (o propagación de incertidumbre) es el efecto de variables de incertidumbre (o errores) en la incertidumbre de una función matemática basada en ellos. Cuando las variables… …   Wikipedia Español

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”