Modelo lineal

Modelo lineal

En estadística, un modelo lineal predice el valor de una variable a través de otras que llamaremos factores mediante una función lineal de estos.[1] Estos factores están determinados por el escenario donde observamos la variable a predecir, a la cual llamaremos variable endógena -generada por el modelo-.

La función lineal suele representarse por:

 \varphi ( x_1 , x_2 , ... , x_p ) = \sum_{j=1}^n \beta_j x_j = \beta_1 x_1 + \beta_2 x_2 + ... + \beta_n x_p

A veces los factores son valores anteriores de la variable dependiente o de otras variables: los modelos lineales también se usan en el contexto de las series temporales.

Contenido

Expresión del modelo

Si llamamos y a la variable dependiente, la expresión del modelo es:

y = β1x1 + β2x2 + ... + βnxp + ε

\varepsilon representa el error cometido por el modelo.

Modelo afín

Es frecuente que nos interese que el modelo lineal tenga un sumando constante. Podemos llamar este caso modelo afín. Para construir este modelo, basta con dar al primer factor el valor constante uno. El modelo quedaría así:

y = β1 + β2x2 + ... + βpxp + ε

Modelos polinomiales

Sorprendentemente, los modelos lineales sirven también para estimar modelos polinomiales. Por ejemplo, si las potencias de una variable explican la variable endógena, el modelo sería:

 y = \beta_1 + \beta_2 \ x + \beta_3 \ x^2 + ... + \beta_p \ x^{p-1} + \varepsilon

Modelos multinomiales

También podemos recurrir a los modelos lineales para estimar modelos multinomiales. Un ejemplo es el siguiente:

 y = \beta_1 + \beta_2 \, x + \beta_3 \, y + \beta_4 \, x^2 + \beta_5 \, xy + \beta_6 \, y^2 + \varepsilon

Estimación del modelo

Para estimar el modelo, tenemos que observar el valor de la variable dependiente y de los factores en m casos. En este caso, las ecuaciones serán:


\left .
   \begin{matrix}
     y_1 = \beta_1 x_{11} + \beta_2 x_{12} + ... + \beta_n x_{1p} + \varepsilon_1 \\
     y_2 = \beta_1 x_{21} + \beta_2 x_{22} + ... + \beta_n x_{2p} + \varepsilon_2 \\
                           .... \\
     y_n = \beta_1 x_{n1} + \beta_2 x_{n2} + ... + \beta_n x_{np} + \varepsilon_n 
        \end{matrix}  \right \}

Este sistema de ecuaciones admite la siguiente expresión vectorial:

 \bold y = \bold X \cdot \boldsymbol \beta + \boldsymbol \varepsilon

El vector de errores cometido por el modelo viene dado por:

 \bold \varepsilon = \bold y - \bold X \cdot \boldsymbol \beta

El estimador minimo cuadrático es aquel que hace mínima la suma de los cuadrados de estos errores. Esta suma es:

No se pudo entender (La conversión a PNG ha sido errónea): SCE = \sum_{i=1}^n \varepsilon_i^2 = \boldsymbol \varepsilon ' \boldsymbol \varepsilon = ( \bold y - \bold X \boldsymbol \hat { \beta } ) ' (\bold y - \bold X \boldsymbol \hat { \beta } )


Observemos que no hemos establecido ninguna restricción para el valor de  \bold \beta . Estamos pues ante un problema de optimización sin restricciones. Los cálculos llevan a las llamadas ecuaciones normales que tiene que verificar el valor de  \bold \beta que hace mínima la suma de los cuadrados de los errores.

No se pudo entender (La conversión a PNG ha sido errónea): \bold X ' \bold X \boldsymbol \hat { \beta } = \bold X ' \bold y


El estimador mínimo-cuadrático para  \bold \beta resulta ser:

No se pudo entender (La conversión a PNG ha sido errónea): { \color{Red} \boldsymbol \hat{ \beta } = ( \bold X ' \bold X )^{-1} \bold X ' \bold y }


El Teorema de Gauss-Márkov nos informa sobre la eficacia de este estimador.

Insesgado

Si los errores -que son variables aleatorias- son insesgados  E( \boldsymbol \varepsilon ) = \bold 0 , el estimador mínimo-cuadrático también lo es:

No se pudo entender (La conversión a PNG ha sido errónea): E(\boldsymbol \hat {\beta} ) = E( ( \bold X ' \bold X ) ^{-1} \bold X ( \bold X \boldsymbol \beta + \boldsymbol \varepsilon ) ) = \boldsymbol \beta + E( ( \bold X ' \bold X) ^{-1} ) X ' \boldsymbol \varepsilon )= \boldsymbol \beta


Es importante que incluyamos en el modelo todos los factores relevantes: si falta alguno, es posible que los errores no tengan media cero y el estimador de los coeficientes será sesgado. No obstante, cualquier buen modelo lineal ayuda a comprender un fenómeno y a hacer buenas estimaciones. Si incluimos factores de influencia dudosa, también podemos provocar un sesgo en el estimador mínimo-cuadrático. Desde hace muchos años, existe una teoría de inferencia en modelos lineales que nos permite decidir -con un pequeño margen de error- si un factor es o no relevante.

Residuos

Los errores cometidos por el modelo cuando se usa el verdadero valor del parámetro son  \boldsymbol \varepsilon = \bold Y - \bold X \boldsymbol \beta . No obstante, nosotros no conocemos el verdadero valor del parámetro  \bold \beta , sino sólo su estimación No se pudo entender (La conversión a PNG ha sido errónea): \bold \hat {\beta}

y esto provoca que no manejemos los verdaderos errores cometidos, sino su estimación, a la que llamaremos residuos y que vienen dados por:

No se pudo entender (La conversión a PNG ha sido errónea): \boldsymbol \hat {\varepsilon} = \bold y - \bold X \boldsymbol \hat {\beta}


En nuestros cálculos, tampoco manejaremos la suma de los cuadrados de los errores, sino la suma de los cuadrados de los residuos:

No se pudo entender (La conversión a PNG ha sido errónea): SCR = \sum_{i=1}^n \hat {\varepsilon_i}^2 = \boldsymbol \hat{\varepsilon} ' \boldsymbol \hat {\varepsilon} = ( \bold y - \bold X \boldsymbol \hat { \beta } ) ' (\bold y - \bold X \boldsymbol \hat { \beta } )


Homocedasticidad

Una cuestión clave es la homocedasticidad de los errores. Decimos que los errores son homocedásticos cuando:

 \exist \sigma^2 \quad \forall i   \quad E( \varepsilon _i^2 )= \sigma^2

Si el error presenta una varianza distinta en cada caso, hablamos de heterocedasticidad.

Modelos de series temporales

Un ejemplo de modelo lineal en series temporales es el Modelo autorregresivo integrado de media móvil, en el que los valores {Xt} de la serie pueden representarse de la forma

 X_t = c + \varepsilon_t +  \sum_{i=1}^p \varphi_i X_{t-i} + \sum_{i=1}^q \theta_i \varepsilon_{t-i}.\,

donde, de nuevo, εt son variables aleatorias que representan las innovaciones: nuevos efectos aleatorios que aparecen en un determinado instante y que afectan a X en lo sucesivo. En este contexto, modelo lineal se refiere de nuevo a la forma algebraica de la relación entre Xt y los valores anteriores de la serie.[2]

Véase también

Referencias

  1. "Linear Regression Analysis" G.A.F Seber Editorial Wiley-Interscience
  2. Priestley, M.B. (1988) Non-linear and Non-stationary time series analysis, Academic Press. ISBN 0-12-564911-8

Wikimedia foundation. 2010.

Игры ⚽ Нужно решить контрольную?

Mira otros diccionarios:

  • Modelo lineal sin umbral — El modelo lineal sin umbral, modelo LSU, o MLSU (en inglés LNTM o simplemente LNT) es un modelo científico del daño causado por la radiación ionizante, en particular del aumento de riesgo de cáncer. El modelo, que utiliza los efectos producidos… …   Wikipedia Español

  • Modelo lineal generalizado — En estadística, el modelo lineal generalizado (MLG) es una flexible generalización de la regresión de mínimos cuadrados ordinaria. Relaciona la distribución aleatoria de la variable dependiente en el experimento (la «función de distribución») con …   Wikipedia Español

  • Lineal B — Tipo Silabario con ideogramas adicionales Idiomas Griego micénico Época HR IIA HR III B2 1450 a. C. 1200 a. C …   Wikipedia Español

  • Modelo de escorrentía — Un modelo de escorrentía es una representación de parte del ciclo hidrológico en cuanto al fenómeno de la escorrentía superficial de una cuenca hidrográfica. El modelo se usa mayormente para entender el proceso de escurrimiento y para… …   Wikipedia Español

  • Modelo autorregresivo de media móvil — En estadística, los modelos autorregresivos de media móvil (en inglés AutoRegressive Moving Average models, abreviados ARMA), también llamados Modelos Box Jenkins, se aplican a series temporales de datos. Dada una serie temporal de datos Xt, el… …   Wikipedia Español

  • Modelo matemático — En ciencias aplicadas, un modelo matemático es uno de los tipos de modelos científicos que emplea algún tipo de formulismo matemático para expresar relaciones, proposiciones sustantivas de hechos, variables, parámetros, entidades y relaciones… …   Wikipedia Español

  • Modelo de color HSL — El modelo HSL (del inglés Hue, Saturation, Lightness – Matiz, Saturación, Luminosidad), que es similar a HSV o HSI (del inglés Hue, Saturation, Intensity – Matiz, Saturación, Intensidad), define un modelo de color en términos de sus componentes… …   Wikipedia Español

  • Modelo de transporte — El modelo de transporte es una clase especial de problema de programación lineal. Su objetivo es determinar las cantidades enviadas de suministro o productos desde cada punto de origen hasta cada punto de destino, que minimice el costo total del… …   Wikipedia Español

  • Modelo de Ising — El modelo de Ising es un modelo físico propuesto para estudiar el comportamiento de materiales ferromagnéticos. Se trata de un modelo paradigmático de la Mecánica Estadística, en parte porque fue uno de los primeros en aparecer, pero sobre todo… …   Wikipedia Español

  • Modelo Input-Output — El Modelo Input Output es un modelo económico desarrollado por Wassily Leontief (1905 1999) por el que obtuvo un Premio Nobel en el año 1973. A menudo es denominado como modelo de Leontief. El propósito fundamental del modelo IO es analizar la… …   Wikipedia Español

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”