Regresión Lineal: Conceptos, Tipos de Datos y Propiedades de Estimadores

Enviado por Programa Chuletas y clasificado en Matemáticas

Escrito el en español con un tamaño de 7,25 KB

Modelo de Regresión Lineal General: Conceptos Clave

1. Expresión del Modelo de Regresión Lineal General (MRLG)

El MRLG se expresa del siguiente modo:

y = β0 + β1x1 + ···· + βkxk + u

donde:

  • y: es la variable de nuestro interés, y se la denomina variable explicada, dependiente o regresada.
  • x1, ····, xk: son las variables que consideramos relevantes para el análisis de la variable de nuestro interés, y se las denomina variables explicativas, independientes o regresoras. El valor de k indica el número de variables explicativas que estamos incluyendo en el modelo.
  • β0, β1, ····, βk: son constantes que desconocemos su valor, pero que nos gustaría conocer ya que miden el efecto que las variables regresoras tienen en la variable regresada. Se les denomina coeficientes del modelo de regresión.
  • u: representa todos aquellos factores que no estamos incluyendo en el modelo y el hecho de que nuestro modelo de regresión no es el verdadero modelo y sólo estamos llevando a cabo una aproximación lineal del modelo verdadero. Se le denomina término de error.

2. Tipos de Datos Económicos

En economía hay dos tipos de datos económicos principales:

  • Datos de corte transversal: son aquellos tomados de diferentes individuos, familias, empresas, colegios, etc., en un mismo instante de tiempo.
  • Datos de series temporales: son aquellos que se toman de una variable a lo largo del tiempo. En este caso, las unidades de medida pueden ser años, meses, semanas, días, etc. Es decir, los datos de series temporales tienen distinta frecuencia.

Existen también:

  • Datos fusionados de sección cruzada: son aquellos tomados de diferentes individuos en dos instantes de tiempo distintos. La razón de tomar este tipo de datos es para analizar si hay diferencias en el efecto de las variables explicativas sobre la variable explicada entre estos dos instantes de tiempo.
  • Datos de panel: son aquellos tomados para diferentes individuos y donde para cada individuo se toma una serie temporal.

3. Supuestos Básicos del MRLG

  • S1: Supuesto de linealidad con respecto a los coeficientes del modelo.
  • S2: La muestra tomada de las variables debe ser una muestra aleatoria.
  • S3: La matriz de observaciones de las variables regresoras debe ser de rango completo. En otras palabras, no deben existir relaciones lineales exactas entre las variables regresoras. A este supuesto se le conoce como la no existencia de multicolinealidad exacta entre las variables regresoras.
  • S4: La esperanza matemática o media de los errores tiene que ser cero. Matemáticamente: E[ui] = 0 para i = 1,..., N.
  • S5: La varianza de los errores debe ser constante (homocedasticidad) y ausencia de correlación serial, la covarianza entre dos errores distintos ha de ser 0.
  • S6: Los errores tienen distribución Normal. (Este supuesto se exige para realizar inferencias).

Medidas de Bondad de Ajuste y su Interpretación

4. Definición e Interpretación de las Medidas de Bondad de Ajuste

SCE es la suma cuadrática explicada, SCT es la suma cuadrática total y SCR es la suma cuadrática residual.

El coeficiente de determinación mide la proporción de la variabilidad de la variable dependiente que es explicada por las variables independientes. El coeficiente de determinación está comprendido entre 0 y 1 y tiene la siguiente interpretación:

  • R2 = 0 implica que el modelo no explica nada de la variabilidad de la variable dependiente, y por tanto valores de R2 próximos a 0 indicarán que la proporción de la variabilidad de la variable dependiente que es explicada por el modelo es baja.
  • R2 = 1 indica que existe una relación lineal exacta entre la variable dependiente y las variables independientes, y por tanto el modelo explica perfectamente la variabilidad de la variable dependiente.

El coeficiente de determinación tiene el inconveniente de que cuando se incrementan progresivamente el número de variables independientes en el modelo, el coeficiente también incrementa, y esto también sucede cuando las nuevas variables tienen escasa o nula relación con la variable dependiente. Con el fin corregir este defecto surge el coeficiente de determinación corregido, Rc2, el cual tiene en cuenta el número de variables regresoras incluidas en el modelo y penaliza la incorporación de nuevas variables.

Estimadores MCO y sus Propiedades

Propiedades (sin demostrar) de los Estimadores MCO de β, Estimación de la Varianza del Error y Definición del Error Estándar para cada Parámetro

  • β es un estimador lineal con respecto a la variable dependiente.
  • β es un estimador insesgado.
  • Var(β) = ...
  • Teorema de Gauss-Markov: Bajo los 5 supuestos del modelo de regresión lineal, el estimador MCO de β es el estimador de menor varianza entre todos los estimadores lineales e insesgados de β.

Contrastes de Significatividad

¿Qué es un contraste de significatividad para un parámetro? ¿Cuál es el objetivo de este contraste?

En los contrastes de significatividad se contrasta si un determinado parámetro del MRLG es o no igual a 0. El objetivo de este contraste es analizar si existen evidencias empíricas que determinen si la variable explicativa relacionada con dicho parámetro es significativa o no. En otras palabras, si existen evidencias empíricas que determinen si esta variable explica o no a la variable explicada.

Heterocedasticidad y Autocorrelación en el MRLG

11. ¿Qué significa que un MRL presenta heterocedasticidad?

Que un MRL presente heterocedasticidad indica que se incumple el supuesto 5 (S5) de homocedasticidad, es decir, que los errores del MRL, denotados como u, tienen distinta varianza. Además, se tiene que seguir satisfaciendo la ausencia de correlación serial, es decir las covarianzas entre dos errores cualquiera es 0.

Situaciones de contraste de cambio estructural en series temporales:

  • La media de la variable dependiente es diferente en dos periodos distintos, pero el efecto de las variables no cambia.
  • El efecto de alguna variable explicativa es diferente en dos periodos distintos.

14. Propiedades del Estimador MCO en Series Temporales cuando los Términos de Error Presentan Autocorrelación

El estimador MCO es insesgado. La expresión de la varianza del estimador MCO (β) con autocorrelación cambia y además ya no va a cumplir el teorema de Gauss-Markov, el estimador MCO (β) ya no tiene por qué ser el estimador lineal e insesgado de menor varianza.

Entradas relacionadas: