Modelos de Regresión con Heterocedasticidad

Enviado por Francisco Jose y clasificado en Matemáticas

Escrito el en español con un tamaño de 3,58 KB

Heterocedasticidad en Modelos de Regresión

Cuando se incumple el supuesto de homocedasticidad, la varianza no es constante y varía con la observación (E[ut2] = δ2t, ∀t).

El modelo de regresión lineal se define como:

ynx1 = Xnxk . βkx1 + unx1

tal que E[ut] = 0nx1 y Var(u) = δ2nxn, donde Ω es una matriz diagonal con diagonal no constante. En este caso, se dice que el modelo tiene una matriz de varianza-covarianza no escalar o con perturbaciones no esféricas. Este fenómeno aparece con datos de sección cruzada.

Causas de la Heterocedasticidad

  • Naturaleza del fenómeno (se da en datos de sección transversal o cruzada).
  • Uso de datos agregados (cuando las observaciones de la variable dependiente pueden dividirse en grupos).
  • Omisión de una variable relevante en el modelo. Es esperable que la perturbación aleatoria dependa de dicha variable omitida, por lo que su varianza no será constante.

Consecuencias de la Heterocedasticidad

El estimador por Mínimos Cuadrados Ordinarios (MCO) del modelo con perturbaciones no esféricas será:

MCO = (XtX)-1Xty

El estimador sigue siendo lineal e insesgado, pero no es óptimo, es decir, no se tiene asegurado que la varianza sea mínima.

Var(^βMCO) = (XtX)-1XtE[u.ut]X(XtX)-1 = δ2(XtX)-1XtΩX(XtX)-1, donde Ω no es igual a δ²(XtX)-1.

Procedimientos de Detección

Se usarán modelos gráficos, los gráficos de los residuos y de dispersión. Se recurrirá a métodos analíticos: Test de Glejser y Goldfeld-Quandt, cuando la muestra es pequeña y una variable es la causa de la heterocedasticidad, y Test de Breusch-Pagan y White, cuando la muestra es grande y no se sabe la/s variable/s que la provocan.

Métodos Gráficos

  • Gráfico de los residuos: gráfico de dispersión de los residuos et o residuos al cuadrado et2 frente a t; si se observan grupos de observaciones con distinta varianza, habrá heterocedasticidad.
  • Gráficos de dispersión: consiste en el diagrama de dispersión de los residuos o residuos al cuadrado frente a la variable independiente que sospechamos puede causar la heterocedasticidad. Si la variabilidad de los residuos aumenta o disminuye conforme aumenta el valor de la variable independiente, podemos pensar que la varianza de la perturbación aleatoria depende de dicha variable, por lo cual habrá heterocedasticidad.

Test de Glejser

  1. Ajustar el modelo original por MCO y obtener los residuos et.
  2. Ajustar por MCO la regresión auxiliar que tiene como variable dependiente el valor absoluto de los residuos anteriores y como independiente la variable que se supone provoca la heterocedasticidad, elevada a h, es decir:

|e| = α + βXth + vt, siendo los valores para h (+-2), (+-1), (+-1/2).

  1. Observar los contrastes de significancia individual de la pendiente de la regresión auxiliar. Rechazar H0: β=0 indica presencia de heterocedasticidad. Al rechazar H0, los residuos dependerán de Xth y consideramos E[ut2] = δ²Xth.

Entradas relacionadas: