Coeficiente de determinación

Coeficiente de determinación

En Estadística, se llama coeficiente de determinación a la proporción de la varianza de la variable dependiente que está explicada por un modelo estadístico.

Caso general

Un modelo estadístico se construye para explicar una variable aleatoria que llamaremos dependiente a través de otras variables aleatorias a las que llamaremos factores. Dado que podemos predecir una variable aleatoria mediante su media y que, en este caso, el error cuadrático medio es su varianza, el máximo error cuadrático medio que podemos aceptar en un modelo para una variable aleatoria que posea los dos primeros momentos es la varianza. Para estimar el modelo haremos varias observaciones de la variable a predecir y de los factores. A la diferencia entre el valor observado de la variable y el valor predicho la llamaremos residuo. La media cuadrática de los residuos es la varianza residual.

Si representamos por σ2 la varianza de la variable dependiente y la varianza residual por \sigma^2_r, el coeficiente de determinación viene dado por la siguiente ecuación:

 \rho^2 = 1 - { {\sigma^2_r} \over  {\sigma^2} }

Se mide en tantos por ciento. Si la varianza residual es cero, el modelo explica el 100% de valor de la variable; si coincide con la varianza de la variable dependiente, el modelo no explica nada y el coeficiente de determinación es del 0%. En variables económicas y financieras, suele ser difícil conseguir un coeficiente de determinación mayor de un 30% .

Modelo lineal

En un modelo lineal, la variable dependiente y se explica mediante la ecuación y= \sum_{j=1}^n \beta_j x_j . Si observamos n veces tanto la variable aleatoria como los factores, podemos ordenar nuestras observaciones de la variable dependiente en una matriz  \bold y mientras que colocaremos las de los factores en la matriz de regresión  \bold X . Cada observación corresponderá a una coordenada de \bold y y a una fila de  \bold X . Cada columna de la matriz de regresión corresponde a las observaciones de un factor. En cada observación el modelo cometerá un error:

 y_i = \sum_{j=1}^m \beta_j x_{ij}  + \varepsilon_i

Estos errores se llaman residuos. La varianza residual es la varianza de estos residuos.

 \sigma_r^2 = \sum_{i=1}^n \varepsilon_i^2  = \bold \varepsilon ' \bold \varepsilon = (\bold y - \bold X \bold \beta ) ' (\bold y - \bold X \bold \beta )

 \sum_{j=1}^n \beta_j x_{ij}  es la parte de la variación de yi explicada por el modelo lineal.

 \varepsilon_i es la parte de la variación de yi que no explica el modelo lineal.

Sumando estas dos partes, obtenemos yi.


Problema: El valor del coeficiente de determinación siempre aumenta cuando incluimos nuevas variables en el modelo, incluso cuando éstas son poco significativas o tienen poca correlación con la variable dependiente. Para resolverlo tenemos el coeficiente de determinación corregido.

Enlaces externos


Wikimedia foundation. 2010.

Игры ⚽ Нужно сделать НИР?

Mira otros diccionarios:

  • Coeficiente de determinación corregido — El coeficiente de determinación corregido en un modelo de regresión lineal mide el porcentaje de variación de la variable dependiente (al igual que el coeficiente de determinación) pero teniendo en cuenta el número de variables incluidas en el… …   Wikipedia Español

  • Coeficiente de reparto — El coeficiente de reparto (K) de una sustancia, también llamado coeficiente de distribución (D), o coeficiente de partición (P), es el cociente o razón entre las concentraciones de esa sustancia en las dos fases de la mezcla formada por dos… …   Wikipedia Español

  • Coeficiente de reparto octanol-agua — El coeficiente de reparto octanol agua(KOW) de una sustancia, también llamado coeficiente de partición (POW), es el cociente o razón entre las concentraciones de esa sustancia en una mezcla bifásica formada por dos disolventes inmiscibles en… …   Wikipedia Español

  • Parámetro estadístico — Saltar a navegación, búsqueda La media aritmética …   Wikipedia Español

  • Multicolinealidad — El proceso o término de multicolinealidad en Econometría es una situación en la que se presenta una fuerte correlación entre variables explicativas del modelo. La correlación ha de ser fuerte, ya que siempre existirá correlación entre dos… …   Wikipedia Español

  • Biorreactor — Saltar a navegación, búsqueda Biorreactor a escala de laboratorio conteniendo células animales. Un biorreactor es un recipiente o sistema que mantiene un ambiente biológicamente activo. En algunos casos, un biorreactor es un recipiente en el que… …   Wikipedia Español

  • Constante de disociación ácida — El ácido acético, un ácido débil puede perder un protón (destacado en verde) y donarlo a una molécula de agua, H20, dando lugar a un anión acetato CH3COO y creando un catión hidronio …   Wikipedia Español

  • Teoría de las semejanzas — Preparando un modelo para su prueba en el túnel aerodinámico La teoría de las semejanzas es aquella que se emplea para el trabajo con modelos a escala en túneles aerodinámicos con el objetivo de que el comportamiento de los mismos sea lo más… …   Wikipedia Español

  • Equilibrio químico — Saltar a navegación, búsqueda En un proceso químico, el equilibrio químico es el estado en el que las actividades químicas o las concentraciones de los reactivos y los productos no tienen ningún cambio neto en el tiempo. Normalmente, este sería… …   Wikipedia Español

  • Péndulo de torsión — Saltar a navegación, búsqueda El péndulo de torsión consiste en un hilo o alambre de sección recta circular suspendido verticalmente, con su extremo superior fijo. En el extremo inferior del hilo se cuelga un cuerpo de momento de inercia I… …   Wikipedia Español

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”