Modelo lineal

En estadística, un modelo lineal predice el valor de una variable a través de otras que llamaremos factores mediante una función lineal de estos.^[1] Estos factores están determinados por el escenario donde observamos la variable a predecir, a la cual llamaremos variable endógena -generada por el modelo-.

La función lineal suele representarse por:

$\varphi ( x_1 , x_2 , ... , x_p ) = \sum_{j=1}^n \beta_j x_j = \beta_1 x_1 + \beta_2 x_2 + ... + \beta_n x_p$

A veces los factores son valores anteriores de la variable dependiente o de otras variables: los modelos lineales también se usan en el contexto de las series temporales.

Contenido

1 Expresión del modelo
2 Estimación del modelo
- 2.1 Insesgado
- 2.2 Residuos
3 Homocedasticidad
4 Modelos de series temporales
5 Véase también
6 Referencias

Expresión del modelo

Si llamamos $y$ a la variable dependiente, la expresión del modelo es:

$y = β 1 x 1 + β 2 x 2 + ... + β n x p + ε$

$\varepsilon$ representa el error cometido por el modelo.

Modelo afín

Es frecuente que nos interese que el modelo lineal tenga un sumando constante. Podemos llamar este caso modelo afín. Para construir este modelo, basta con dar al primer factor el valor constante uno. El modelo quedaría así:

$y = β 1 + β 2 x 2 + ... + β p x p + ε$

Modelos polinomiales

Sorprendentemente, los modelos lineales sirven también para estimar modelos polinomiales. Por ejemplo, si las potencias de una variable explican la variable endógena, el modelo sería:

$y = \beta_1 + \beta_2 \ x + \beta_3 \ x^2 + ... + \beta_p \ x^{p-1} + \varepsilon$

Modelos multinomiales

También podemos recurrir a los modelos lineales para estimar modelos multinomiales. Un ejemplo es el siguiente:

$y = \beta_1 + \beta_2 \, x + \beta_3 \, y + \beta_4 \, x^2 + \beta_5 \, xy + \beta_6 \, y^2 + \varepsilon$

Estimación del modelo

Para estimar el modelo, tenemos que observar el valor de la variable dependiente y de los factores en $m$ casos. En este caso, las ecuaciones serán:

$\left . \begin{matrix} y_1 = \beta_1 x_{11} + \beta_2 x_{12} + ... + \beta_n x_{1p} + \varepsilon_1 \\ y_2 = \beta_1 x_{21} + \beta_2 x_{22} + ... + \beta_n x_{2p} + \varepsilon_2 \\ .... \\ y_n = \beta_1 x_{n1} + \beta_2 x_{n2} + ... + \beta_n x_{np} + \varepsilon_n \end{matrix} \right \}$

Este sistema de ecuaciones admite la siguiente expresión vectorial:

$\bold y = \bold X \cdot \boldsymbol \beta + \boldsymbol \varepsilon$

El vector de errores cometido por el modelo viene dado por:

$\bold \varepsilon = \bold y - \bold X \cdot \boldsymbol \beta$

El estimador minimo cuadrático es aquel que hace mínima la suma de los cuadrados de estos errores. Esta suma es:

No se pudo entender (La conversión a PNG ha sido errónea): SCE = \sum_{i=1}^n \varepsilon_i^2 = \boldsymbol \varepsilon ' \boldsymbol \varepsilon = ( \bold y - \bold X \boldsymbol \hat { \beta } ) ' (\bold y - \bold X \boldsymbol \hat { \beta } )

Observemos que no hemos establecido ninguna restricción para el valor de $\bold \beta$ . Estamos pues ante un problema de optimización sin restricciones. Los cálculos llevan a las llamadas ecuaciones normales que tiene que verificar el valor de $\bold \beta$ que hace mínima la suma de los cuadrados de los errores.

No se pudo entender (La conversión a PNG ha sido errónea): \bold X ' \bold X \boldsymbol \hat { \beta } = \bold X ' \bold y

El estimador mínimo-cuadrático para $\bold \beta$ resulta ser:

No se pudo entender (La conversión a PNG ha sido errónea): { \color{Red} \boldsymbol \hat{ \beta } = ( \bold X ' \bold X )^{-1} \bold X ' \bold y }

El Teorema de Gauss-Márkov nos informa sobre la eficacia de este estimador.

Insesgado

Si los errores -que son variables aleatorias- son insesgados $E( \boldsymbol \varepsilon ) = \bold 0$ , el estimador mínimo-cuadrático también lo es:

No se pudo entender (La conversión a PNG ha sido errónea): E(\boldsymbol \hat {\beta} ) = E( ( \bold X ' \bold X ) ^{-1} \bold X ( \bold X \boldsymbol \beta + \boldsymbol \varepsilon ) ) = \boldsymbol \beta + E( ( \bold X ' \bold X) ^{-1} ) X ' \boldsymbol \varepsilon )= \boldsymbol \beta

Es importante que incluyamos en el modelo todos los factores relevantes: si falta alguno, es posible que los errores no tengan media cero y el estimador de los coeficientes será sesgado. No obstante, cualquier buen modelo lineal ayuda a comprender un fenómeno y a hacer buenas estimaciones. Si incluimos factores de influencia dudosa, también podemos provocar un sesgo en el estimador mínimo-cuadrático. Desde hace muchos años, existe una teoría de inferencia en modelos lineales que nos permite decidir -con un pequeño margen de error- si un factor es o no relevante.

Residuos

Los errores cometidos por el modelo cuando se usa el verdadero valor del parámetro son $\boldsymbol \varepsilon = \bold Y - \bold X \boldsymbol \beta$ . No obstante, nosotros no conocemos el verdadero valor del parámetro $\bold \beta$ , sino sólo su estimación No se pudo entender (La conversión a PNG ha sido errónea): \bold \hat {\beta}

y esto provoca que no manejemos los verdaderos errores cometidos, sino su estimación, a la que llamaremos residuos y que vienen dados por:

No se pudo entender (La conversión a PNG ha sido errónea): \boldsymbol \hat {\varepsilon} = \bold y - \bold X \boldsymbol \hat {\beta}

En nuestros cálculos, tampoco manejaremos la suma de los cuadrados de los errores, sino la suma de los cuadrados de los residuos:

No se pudo entender (La conversión a PNG ha sido errónea): SCR = \sum_{i=1}^n \hat {\varepsilon_i}^2 = \boldsymbol \hat{\varepsilon} ' \boldsymbol \hat {\varepsilon} = ( \bold y - \bold X \boldsymbol \hat { \beta } ) ' (\bold y - \bold X \boldsymbol \hat { \beta } )

Homocedasticidad

Una cuestión clave es la homocedasticidad de los errores. Decimos que los errores son homocedásticos cuando:

$\exist \sigma^2 \quad \forall i \quad E( \varepsilon _i^2 )= \sigma^2$

Si el error presenta una varianza distinta en cada caso, hablamos de heterocedasticidad.

Modelos de series temporales

Un ejemplo de modelo lineal en series temporales es el Modelo autorregresivo integrado de media móvil, en el que los valores {X_t} de la serie pueden representarse de la forma

$X_t = c + \varepsilon_t + \sum_{i=1}^p \varphi_i X_{t-i} + \sum_{i=1}^q \theta_i \varepsilon_{t-i}.\,$

donde, de nuevo, ε_t son variables aleatorias que representan las innovaciones: nuevos efectos aleatorios que aparecen en un determinado instante y que afectan a X en lo sucesivo. En este contexto, modelo lineal se refiere de nuevo a la forma algebraica de la relación entre X_t y los valores anteriores de la serie.^[2]

Véase también

Referencias

↑ "Linear Regression Analysis" G.A.F Seber Editorial Wiley-Interscience
↑ Priestley, M.B. (1988) Non-linear and Non-stationary time series analysis, Academic Press. ISBN 0-12-564911-8

Categorías:

Análisis de la regresión
Modelos de series temporales
Modelos estadísticos
Terminología estadística

Wikimedia foundation. 2010.

Игры ⚽ Нужен реферат?

Mira otros diccionarios:

Modelo lineal sin umbral — El modelo lineal sin umbral, modelo LSU, o MLSU (en inglés LNTM o simplemente LNT) es un modelo científico del daño causado por la radiación ionizante, en particular del aumento de riesgo de cáncer. El modelo, que utiliza los efectos producidos… … Wikipedia Español
Modelo lineal generalizado — En estadística, el modelo lineal generalizado (MLG) es una flexible generalización de la regresión de mínimos cuadrados ordinaria. Relaciona la distribución aleatoria de la variable dependiente en el experimento (la «función de distribución») con … Wikipedia Español
Lineal B — Tipo Silabario con ideogramas adicionales Idiomas Griego micénico Época HR IIA HR III B2 1450 a. C. 1200 a. C … Wikipedia Español
Modelo de escorrentía — Un modelo de escorrentía es una representación de parte del ciclo hidrológico en cuanto al fenómeno de la escorrentía superficial de una cuenca hidrográfica. El modelo se usa mayormente para entender el proceso de escurrimiento y para… … Wikipedia Español
Modelo autorregresivo de media móvil — En estadística, los modelos autorregresivos de media móvil (en inglés AutoRegressive Moving Average models, abreviados ARMA), también llamados Modelos Box Jenkins, se aplican a series temporales de datos. Dada una serie temporal de datos Xt, el… … Wikipedia Español
Modelo matemático — En ciencias aplicadas, un modelo matemático es uno de los tipos de modelos científicos que emplea algún tipo de formulismo matemático para expresar relaciones, proposiciones sustantivas de hechos, variables, parámetros, entidades y relaciones… … Wikipedia Español
Modelo de color HSL — El modelo HSL (del inglés Hue, Saturation, Lightness – Matiz, Saturación, Luminosidad), que es similar a HSV o HSI (del inglés Hue, Saturation, Intensity – Matiz, Saturación, Intensidad), define un modelo de color en términos de sus componentes… … Wikipedia Español
Modelo de transporte — El modelo de transporte es una clase especial de problema de programación lineal. Su objetivo es determinar las cantidades enviadas de suministro o productos desde cada punto de origen hasta cada punto de destino, que minimice el costo total del… … Wikipedia Español
Modelo de Ising — El modelo de Ising es un modelo físico propuesto para estudiar el comportamiento de materiales ferromagnéticos. Se trata de un modelo paradigmático de la Mecánica Estadística, en parte porque fue uno de los primeros en aparecer, pero sobre todo… … Wikipedia Español
Modelo Input-Output — El Modelo Input Output es un modelo económico desarrollado por Wassily Leontief (1905 1999) por el que obtuvo un Premio Nobel en el año 1973. A menudo es denominado como modelo de Leontief. El propósito fundamental del modelo IO es analizar la… … Wikipedia Español

Los diccionarios y las enciclopedias sobre el Académico

Modelo lineal

Contenido