Varianza

Varianza

En teoría de probabilidad, la varianza (que suele representarse como σ2) de una variable aleatoria es una medida de su dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media.

Está medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. La desviación estándar, la raíz cuadrada de la varianza, es una medida de dispersión alternativa expresada en las mismas unidades. La varianza tiene como valor mínimo 0.

Hay que tener en cuenta que la varianza puede verse muy influida por los valores atípicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de dispersión más robustas.

El término varianza fue acuñado por Ronald Fisher en un artículo de 1918 titulado The Correlation Between Relatives on the Supposition of Mendelian Inheritance.

Contenido

Definición

Dada una variable aleatoria X con media μ = E(X), se define su varianza, Var(X) (también representada como \scriptstyle\sigma_X^2 o, simplemente σ2), como

\operatorname{Var}(X) = \operatorname{E}[ ( X - \mu ) ^ 2].\,

Desarrollando la definición anterior, se obtiene la siguiente definición alternativa (y equivalente):


\begin{align}
\operatorname{Var}(X) & = \operatorname{E}[ ( X - \mu ) ^ 2 ] \\
& = \operatorname{E}[ ( X ^ 2 - 2X\mu + \mu ^ 2) ] \\
& = \operatorname{E}( X ^ 2) - 2\mu\operatorname{E}(X) + \mu ^ 2 \\
& =\operatorname{E}( X ^ 2) - 2\mu ^ 2 + \mu ^ 2 \\
& = \operatorname{E} ( X ^ 2) - \mu ^ 2.
\end{align}

Si una distribución no tiene esperanza, como ocurre con la de Cauchy, tampoco tiene varianza. Existen otras distribuciones que, aun teniendo esperanza, carecen de varianza. Un ejemplo de ellas es la de Pareto cuando su índice k satisface 1 < k ≤ 2.

Caso continuo

Si la variable aleatoria X es continua con función de densidad f(x), entonces

\operatorname{Var}(X) =\int (x-\mu)^2 \, f(x) \, dx\,,

donde

\mu = \int x \, f(x) \, dx\,,

y las integrales están definidas sobre el rango de X.

Caso discreto

Si la variable aleatoria X es discreta con pesos x1 ↦ p1, ..., xn ↦ pn, entonces

\operatorname{Var}(X) = \sum_{i=1}^n p_i\cdot(x_i - \mu)^2

donde

\mu = \sum_{i=1}^n p_i\cdot x_i .

Ejemplos

Distribución exponencial

La distribución exponencial de parámetro λ es una distribución continua con soporte en el intervalo [0,∞) y función de densidad

f(x) = \lambda e^{-\lambda x}1_{[0,\infty)}(x),\,

Tiene media μ = λ−1. Por lo tanto, su varianza es:

\int_0^\infty f(x) (x - \mu)^2\,dx = \int_0^\infty \lambda e^{-\lambda x} (x - \lambda^{-1})^2\,dx = \lambda^{-2}.\,

Es decir, σ2 = μ2.

Dado perfecto

Un dado de seis caras puede representarse como una variable aleatoria discreta que toma, valores del 1 al 6 con probabilidad igual a 1/6. El valor esperado es (1+2+3+4+5+6)/6 = 3,5. Por lo tanto, su varianza es:

\sum_{i=1}^6 \tfrac{1}{6} (i - 3,5)^2 = \tfrac{1}{6}\left((-2,5)^2{+}(-1,5)^2{+}(-0,5)^2{+}0,5^2{+}1,5^2{+}2,5^2\right) = \tfrac{1}{6} \cdot 17,50 = \tfrac{35}{12} \approx 2,92\,.

Propiedades de la varianza

Algunas propiedades de la varianza son:

  • V(X) \geq 0 \,\!
  • V(aX + b) = a^2 V(X) \,\! siendo a y b números reales cualesquiera. De esta propiedad se deduce que la varianza de una constante es cero, es decir, V(b) = 0 \,\!
  • V(X+Y) = V(X)+V(Y)+2Cov(X,Y) \,\!, donde Cov(X,Y) es la covarianza de X e Y.
  • V(X-Y) = V(X)+V(Y)-2Cov(X,Y) \,\!, donde Cov(X,Y) es la covarianza de X e Y.

Varianza muestral

En muchas situaciones es preciso estimar la varianza de una población a partir de una muestra. Si se toma una muestra con reemplazamiento (y_1,\dots,y_n) de n valores de ella, de entre todos los estimadores posibles de la varianza de la población de partida, existen dos de uso corriente:

s_n^2 = \frac 1n \sum_{i=1}^n \left(y_i - \overline{y} \right)^ 2 = \left(\frac{1}{n} \sum_{i=1}^{n}y_i^2\right) - \overline{y}^2

y

s^2 = \frac 1{n-1}\sum_{i=1}^n\left(y_i - \overline{y} \right)^ 2 = \frac{1}{n-1}\sum_{i=1}^n y_i^2 - \frac{n}{n-1} \overline{y}^2 = \frac{\sum_{i=1}^n y_i^2 - n\overline{y}^2}{n-1}

Cuando los datos están agrupados:

s^2 = \frac{\sum_{i=1}^n f_i \left(y_i - \overline{y} \right)^ 2}{n-1} =  \frac{\sum_{i=1}^n f_i y_i^2 - n\overline{y}^2}{n-1}

A los dos (cuando está dividido por n y cuando lo está por n-1) se los denomina varianza muestral. Difieren ligeramente y, para valores grandes de n, la diferencia es irrelevante. El primero traslada directamente la varianza de la muestra al de la población y el segundo es un estimador insesgado de la varianza de la población. De hecho,


\begin{align}
\operatorname{E}[s^2] & = \operatorname{E}\left[\frac{1}{n-1} \sum_{i=1}^n Y_i^2 ~ - ~ \frac{n}{n-1} \overline{Y}^2 \right] \\
& = \frac{1}{n-1}\left( \sum \operatorname{E}[Y_i^2] ~ - ~ n \operatorname{E}[\overline{Y}^2] \right) \\
& = \frac{1}{n-1}\left(    n \operatorname{E}[Y_1^2] ~ - ~ n \operatorname{E}[\overline{Y}^2] \right) \\
& = \frac{n}{n-1}\left( \operatorname{Var}(Y_1) + \operatorname{E}[Y_1]^2 ~ - ~ \operatorname{Var}(\overline{Y}) - \operatorname{E}[\overline{Y}]^2 \right) \\
& = \frac{n}{n-1}\left( \operatorname{Var}(Y_1) + \mu^2 ~ - ~ \frac{1}{n}\operatorname{Var}(Y_1) - \mu^2 \right) \\
& = \frac{n}{n-1}\left( \frac{n-1}{n} ~ \operatorname{Var}(Y_1) \right) \\
& = \operatorname{Var}(Y_1) \\
& = \sigma^2
\end{align}

mientras que

E[s_n^2] = \frac{n-1}{n} \sigma^2

Propiedades de la varianza muestral

Como consecuencia de la igualdad  \operatorname{E}(s^2)=\sigma^2, s2 es un estadístico insesgado de σ2. Además, si se cumplen las condiciones necesarias para la ley de los grandes números, s2 es un estimador consistente de σ2.

Más aún, cuando las muestras siguen una distribución normal, por el teorema de Cochran, s2 tiene la distribución chi-cuadrado:


(n-1)\frac{s^2}{\sigma^2}\sim\chi^2_{n-1}.

Véase también

Enlaces externos


Wikimedia foundation. 2010.

Игры ⚽ Нужен реферат?

Mira otros diccionarios:

  • Varianza — varianza. f. Estad. Media de las desviaciones cuadráticas de una variable aleatoria, referidas al valor medio de esta. * * * En teoría de probabilidad y estadística la varianza es un estimador de la divergencia de una variable aleatoria de su… …   Enciclopedia Universal

  • varianza — en estadística, cuadrado de la desviación estándar, es decir, la media de las desviaciones cuadráticas de una variable aleatoria, referidas al valor medio de ésta. variante. Diccionario ilustrado de Términos Médicos.. Alvaro Galiano. 2010. v …   Diccionario médico

  • varianza — /va rjantsa/ s.f. [der. di variare ]. 1. (ant., lett.) [il modificare o l essere modificato e, anche, il loro risultato] ▶◀ [➨ variazione (1)]. 2. (biol.) [con riferimento ai geni umani, l essere variabile] ▶◀ variabilità. ◀▶ invariabilità,… …   Enciclopedia Italiana

  • varianza — f. Estad. Media de las desviaciones cuadráticas de una variable aleatoria, referidas al valor medio de esta …   Diccionario de la lengua española

  • varianza — va·riàn·za s.f. 1. LE il variare; variazione, modificazione: non cessò di ritrarla in tutti i volti graziosi, pur con qualche leggera varianza (D Annunzio) 2. TS biol. → variabilità 3. TS fis. in termodinamica, numero di parametri macroscopici… …   Dizionario italiano

  • varianza —   Eng. variance   Indicatore statistico. La radice quadrata della varianza, cioè la standard deviation, è usata quale misura della rischiosità di un attività …   Glossario di economia e finanza

  • varianza — Economía. Es el momento segundo respecto a la media aritmética, o la media aritmética de los cuadrados de las desviaciones de los datos respecto a su media aritmética. Mide la dispersión sobre la media de una determinada distribución …   Diccionario de Economía Alkona

  • varianza — pl.f. varianze …   Dizionario dei sinonimi e contrari

  • varianza — Economía. Es el momento segundo respecto a la media aritmética, o la media aritmética de los cuadrados de las desviaciones de los datos respecto a su media aritmética. Mide la dispersión sobre la media de una determinada distribución …   Diccionario de Economía

  • Análisis de la varianza — En estadística, el análisis de la varianza (ANOVA, ANalysis Of VAriance, según terminología inglesa) es una colección de modelos estadísticos y sus procedimientos asociados, en el cual la varianza está particionada en ciertos componentes debidos… …   Wikipedia Español

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”