Econometría: Conceptos, Modelos y Tipos de Datos

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 22,26 KB

Econometría: Definición y Modelos

La econometría es la rama de la economía que se ocupa de la estimación práctica de las relaciones económicas. Un modelo es la representación, necesariamente simplificada, de cualquier fenómeno, proceso, institución y, en general, cualquier sistema.

Modelo Económico vs. Modelo Econométrico

Modelo Económico: Son modelos genéricos que son aplicables con validez general a diversos sistemas concretos. Son modelos expuestos de forma matemática. El problema de este modelo es que aparece demasiado simplificado y excesivamente genérico como para recoger todos los aspectos de los sistemas generales.

Modelo Econométrico: Son modelos específicos basados necesariamente en un modelo económico más o menos general y formalizado, y completados con los aspectos particulares propios del sistema de estudio. Por lo tanto, perderá generalidad, pero será más válido porque se ajusta más al tema de estudio.

Modelo Económico

Modelo Econométrico

Especificación

Especificación normal

Especificación más concreta, estadísticamente más precisa

Forma Funcional

Puede eludir la forma funcional

Siempre existe una forma funcional definida

Dinamicidad

Puede eludir la dinamicidad

Obliga a considerar el tiempo en la mayoría de los modelos econométricos

Relación entre las Variables

Relaciones exactas

Relaciones no deterministas con uno o varios elementos al azar

Aleatoriedad

Las variables relevantes para estos modelos, no suelen coincidir plenamente con las de un modelo econométrico

No coinciden las variables relevantes del modelo económico por:

  • Olvido de variables en situaciones determinadas.
  • Inclusión implícita de variables en el modelo económico.
  • Posibles no constancia de variables que sí lo son en el modelo económico.

Estructura y Cambios en la Estructura de los Modelos

La estructura es un punto clave para la correcta utilización de los modelos. Al especificar y estimar sus parámetros, puede plantearse dudas sobre la permanencia estructural, tanto en el periodo de observación como para el futuro. El problema está en si se consideran unos parámetros fijos y no lo son, ante esta situación estaremos trabajando con un modelo que se aleja de la realidad.

Cambios en la Estructura

  1. Se mantienen las mismas variables del modelo y solo cambia el valor de los coeficientes. Ante esto, puede darse un cambio real de estructura o que sea una simple adaptación técnica del modelo. Si es un cambio estructural habrá que estimar de nuevo el modelo y los parámetros.
  2. Se incorporan nuevas variables al modelo, pero se mantiene básicamente el sistema original. Al introducir nuevas variables los coeficientes también varían. Se tendría que recalcular el modelo, los coeficientes y las relaciones.
  3. Se incorporan nuevas variables al modelo que corresponden a un nuevo sistema. En este caso variará el sistema y las relaciones entre las variables.

Elementos de un Modelo Econométrico

  1. Relación Funcional:
    • a) Lineal
    • b) Linealizables

    Para medir una misma variable, existen distintas posibilidades.

  2. Variables del Modelo:
    • A) Endógenas (a explicar)
    • B) Exógenas (explicativas)
    • C) Predeterminadas: endógenas y exógenas desplazadas.
    • D) Matemáticas (deterministas) y estocásticas (no deterministas)
  3. Parámetros del Modelo:
    • Los parámetros son los coeficientes que acompañan a las variables exógenas, y representan la relación existente entre la endógena y las exógenas.
    • Los parámetros son constantes, son fijos, por lo que tienen permanencia estructural.
    • Estos parámetros significan elasticidades, propensiones marginales.

Etapas de la Especificación de un Modelo Econométrico

  • Especificación de relaciones lineales.
  • Selección de variable(s) a estudiar y de variable(s) explicativas. Relación Lineal o Linealizable.
  • Matriz de información (valores de las variables).
  • Interpretación económica (Signos del modelo estimado y consistencia sobre teoría o hipótesis económica).
  • Componente aleatoria: hipótesis de Normalidad (con media y varianzas constantes).
  • Obtención del Modelo Lineal.

Aleatoriedad, Dinamicidad y Simultaneidad en Modelos Econométricos

Para aceptar la naturaleza de los modelos estocásticos en economía, considerando de nuevo la función de consumo, en ella se especifica que, a cualquier nivel de ingreso nacional (PIB), el consumo está determinado en forma precisa como el número +. Esto, en sí, no es razonable, ya que además del Ingreso existen otros factores que pueden afectar, y de hecho afectan, al consumo (riqueza, precios, preferencias...). Por tanto, lo lógico, para un nivel de renta o ingresos, es plantear esa expresión (+), pero como promedio, por lo que estaremos tratando el consumo dentro de un intervalo de confianza.

Teoría Central del Límite: Establece que si tenemos un grupo numeroso de variables independientes y todas ellas siguen el mismo modelo de distribución, la suma de ellos se distribuye según una distribución normal.

Tipos de Datos Económicos

(a) Experimentales o No Experimentales

  • No experimentales:
    • En Econometría utilizamos datos no experimentales.
    • Los datos no experimentales se recogen mediante la observación del mundo real de una manera pasiva. En este caso los datos no son el resultado de experimentos controlados.
    • Se obtienen de observaciones de un sistema no sujeto a control experimental. El experimentador no controla las condiciones.
    • Tras el suceso natural, que no puede controlarse, se recoge la información. Los datos económicos se extraen de la medición del suceso, una vez que ha ocurrido.
    • Información de ciencias sociales.
  • Experimentales:
    • Los datos experimentales se recogen a menudo en entornos de laboratorio, como ocurre en las ciencias naturales. Se obtienen a partir de un experimento controlado.

(b) Cuantitativos y Cualitativos

  • Cuantitativos:
    • Datos medibles cardinalmente, expresados en números.
    • Se materializan en variables cuantitativas.
  • Cualitativos:
    • Miden atributos.
    • No hay medición numérica.
    • Pueden expresarse en forma de datos.

(c) Datos Subjetivos u Observacionales

  • Subjetivos
  • Observacionales: No tienen componente subjetivo. Se recogen de la realidad tal y como son.

(d) Series Temporales, De Corte Transversal o Datos de Panel

  • Serie temporal (dimensión temporal):
    • Datos recogidos de 1 variable referente a un fenómeno concreto a lo largo del tiempo.
    • Incorpora información de variables o unidades de estudio individuales, durante un período de tiempo usualmente igual, en este caso cada periodo de tiempo constituye un elemento poblacional o muestral (dimensión temporal).
  • Corte Transversal (Dimensión estructural):
    • Se refiere a información de 1 variable, 1 fenómeno, para varios individuos en un periodo de tiempo concreto.
    • Incorpora el aspecto temporal, representa el análisis de información para las unidades individuales de estudio, en un momento determinado de tiempo (dimensión estructural).
    • En la mayoría de los estudios, los individuos encuestados son personas. Las encuestas son una fuente típica para datos de corte transversal.
    • En muchos estudios econométricos contemporáneos de corte transversal el tamaño muestral es bastante elevado. En los datos de corte transversal, las observaciones deben ser obtenidas mediante un muestreo aleatorio, lo que implica que las observaciones sean independientes entre sí.
  • Datos de panel:
    • Los datos de panel consisten en observaciones de corte transversal repetidas a lo largo del tiempo. Incluyen una muestra de individuos para un período determinado de tiempo, combinando de esta forma los dos tipos de datos que hemos mencionado con anterioridad (dimensión temporal y dimensión estructural).

(e) Series de Alta y Baja Frecuencia Temporal

La información de las variables a analizar puede ofrecerse en distintas frecuencias: anual, semanal y diaria.

(f) Macroeconómicos o Microeconómicos

(g) En Niveles o en Euros o Pesetas Constantes

(h) En Tasas o en Unidades

Problemática de los Datos para la Modelización

En general, a la hora de construir un modelo, la información no está disponible de la forma deseada. Por lo que pueden encontrarse diferentes tipos de problemas asociados a este hecho:

  • A. Problemas en las fuentes estadísticas.
  • B. Problemas en los métodos de obtención de los datos.
  • C. Problemas por cambio de estructura.
  • D. Problemas técnicos.

A. Problema Atribuible a la Fuente Estadística

Dentro de este tipo de problemas tenemos:

  • Lagunas estadísticas: No siempre, por diversas razones, existen todos los datos referentes a un fenómeno. Bien por conflictos bélicos, bien por otros problemas, aparecen variables con datos conocidos, antes y después de estos hechos. En estos casos puede recurrirse a técnicas de interpolación (cuando falta algún dato intermedio) o extrapolación (cuando no existen datos del último año o de los primeros).
  • Cambios metodológicos: Cuando extraemos información de una fuente estadística, debemos prestar atención a los posibles cambios en la variable:
    • Cambios metodológicos conceptuales (cambia la denominación de la variable que recoge el fenómeno en estudio).
    • Cambios metodológicos de valoración (la misma variable se obtiene por agregación distinta a la que se venía obteniendo).

B. Problemas Atribuibles al Método de Obtención

Pueden producirse por dos motivos fundamentalmente:

  • Errores de muestreo: Por la simple equivocación al realizar el muestreo, o por errores al transcribir los resultados del muestreo.
  • Errores de observación y/o medida: Los datos que están medidos son sujetos a diversas imprecisiones y desviaciones. De hecho, los datos a menudo son revisados debido a un reconocimiento posterior de estas imprecisiones y desviaciones. Las imprecisiones suelen provocarse por la falta de una correcta conceptualización. Si existen cambios en conceptualización se ha de reconfigurar los datos para poder hacerlos comparables y consistentes en el tiempo.

C. Cambios Estructurales

Provocados por:

  • Cambios en año base de referencia: Podemos estar trabajando con una serie con observaciones hasta el año 1999, y encontrarnos con datos hasta el 90 con año base 80, y a partir de 1991 con año base 86. No podemos mezclarlos, habría que transformar uno de los dos en el año base del otro.
  • Datos estructuralmente heterogéneos: Puede producirse un cambio discontinuo en el mundo real de modo que los datos se refieran a diferentes poblaciones. Recurriendo al ejemplo de conflictos bélicos, la situación anterior y posterior a este conflicto es diferente: menos población, tejidos industriales destruidos...

D. Problemas Técnicos

  1. Grados de libertad. No incluye suficientes observaciones.
  2. Variables no observables. Solución variables proxy.
  3. Multicolinealidad. Dependencia entre variables explicativas, los datos tienden a moverse juntos.
  4. Correlación serial. Al observarse datos a lo largo del tiempo.

Tratamiento y Depuración de Datos

Los datos obtenidos de diferentes fuentes deben ser “reconfigurados” de distintas maneras para poder realizar un estudio econométrico. La reconfiguración será necesaria para conseguir un conjunto de datos consistente, que represente series comparables, y que sea posible comparar de manera que se puedan utilizar para la realización de nuestra investigación.

Para series temporales podemos reconfigurar por medio de: interpolación, extrapolación, homogeneización año base, alisados...

  1. Interpolación: La interpolación consiste en determinar valores que se encuentran entre otros valores conocidos. Interpolación lineal y exponencial.
  2. Extrapolación: En este caso hay que completar la serie para los primeros datos, ya que si fuese para los últimos, sería una predicción (si se hace, sería muy justificadamente).
  3. Homogeneización Año Base: se refiere al problema que surge cuando cambia el año base. Habrá que reconfigurar la serie para hacerla consistente y comparable. Generalmente, este problema aparece cuando trabajamos con datos de series temporales en forma de números índices (como IPC).

Especificación del Modelo Lineal

Suponemos el comportamiento de una variable endógena que puede ser explicado mediante una relación lineal de k variables exógenas, xj, más un término de error o perturbación aleatoria, u, que recoge el efecto conjunto con otras variables no directamente explicitadas en el modelo, cuyo efecto individual no resulta relevante:

Esta ecuación puede representar un modelo en sí misma, o formar parte, junto con otro grupo de ecuaciones, de un modelo más amplio.

Para hacer operativo el modelo, partimos de n observaciones seleccionadas del sistema real, para todas las variables que forman parte del modelo. Por lo tanto, se podrá plantear un sistema de ecuaciones en el que cada ecuación será el modelo definido para cada uno de los “n” datos o puntos muestrales. Generalmente, el modelo se representa:

Habitualmente se trabaja con término independiente, con lo cual, en la matriz X aparecerá una primera columna de 1:

Se denomina Modelo Básico, ya que juega un papel muy importante en la modelización econométrica cuando se simplifica al máximo mediante las siguientes hipótesis de trabajo:

  1. Las variables exógenas son no estocásticas, y no existe entre ellas ninguna relación lineal exacta.
  2. El término de error o perturbación aleatoria tiene media nula y varianza constante para todas las observaciones.
  3. No existe correlación entre los errores correspondientes a observaciones.

La especificación lineal del modelo junto con las hipótesis establecidas, nos sitúan en posición de considerar aspectos de aplicabilidad y de limitaciones del MBRL (modelo básico de regresión lineal). A tener en cuenta nueve puntos:

Determinista

  1. Información Estadística: Se necesita un número de observaciones de cada variable suficiente para que el modelo sea representativo (n > k).
  2. Estructura Única: Al suponer la constancia de los parámetros del modelo, admitimos la existencia de una estructura única para todo el periodo de observación, así como hasta el horizonte de predicción.
  3. Relación Funcional: Existe una relación lineal entre las variables, por dos motivos:
    • Empíricamente se ha demostrado que con las relaciones lineales entre varias variables se consigue aproximaciones suficientemente válidas para explicar el comportamiento de los fenómenos reales.
    • Ciertas relaciones no lineales pueden transformarse fácilmente en líneas mediante un cambio de variable.
  4. El Carácter No Estocástico de las Variables Exógenas:
    • El carácter no estocástico de las variables explicativas lleva consigo el que la única fuente de aleatoriedad en el comportamiento de la variable endógena es precisamente el término de error.
    • Esta hipótesis podría sustituirse por la de aleatoriedad de las variables endógenas, pero considerando siempre que no están correlacionadas con el término de error. De este modo, podemos incluir en el modelo variables endógenas desplazadas en el tiempo como explicativas, pero, como hemos advertido, siempre que se cumpla la polémica hipótesis de ausencia de correlación entre las perturbaciones aleatorias correspondientes a distintas observaciones.
  5. Inexistencia de Relación Lineal Exacta entre las Variables Exógenas: Sería lo ideal porque sino incurriríamos en problemas de multicolinealidad.

Aleatorias

  1. Hipótesis de Nulidad [E(u)=0]: Nulidad para la media de las distribuciones de las perturbaciones aleatorias correspondientes a cualquier observación. De existir, su influencia sobre los resultados es mínima.
  2. Varianza Constante: La varianza constante de las perturbaciones. Esta hipótesis exigirá trabajar con una variable endógena que no tuviese un recorrido excesivamente amplio, ya que por tratarse de una medida absoluta de dispersión puede plantearse su variación con la cuantía de la variable.
  3. Hipótesis de Ausencia de Autocorrelación en las Perturbaciones Aleatorias: Es la más conflictiva. Su cumplimiento exige un modelo bien especificado, ya que si dejamos alguna variable explicativa importante sin incluir, su efecto sistemático se hará notar a través del término de error. Por tanto, si no incluimos una variable relevante xk del modelo y tiene un efecto positivo importante sobre la evolución de yi, el error será por defecto durante el periodo en que esta variable xk experimente un incremento (no recogido por el modelo explícitamente). En otras palabras, el error recogerá el efecto sistemático de las variaciones de xk y provocará una correlación entre los errores correspondientes a periodos sucesivos.

Estimación por MCO y MV

Estimadores Mínimos Cuadráticos (MCO): Son aquellos estimadores que hacen mínima la suma de las diferencias al cuadrado entre los valores reales y estimados de la variable endógena.

  1. Derivadas parciales respecto al estimador igual a 0.
  2. Segundas derivadas positivas. Resultado (x`x)-1x`y.

Estimadores Máximo Verosímil (MV): Serán aquellos que son más probables dada la distribución de los datos muestrales y su implicación sobre la función de densidad conjunta. Para aplicar este método, debemos admitir la hipótesis de normalidad y por ello la función de densidad seguirá una distribución normal, el cual nos dará el mismo resultado que con método de MCO. Resultado (x`x)-1x`y.

Distribución y Propiedades de los Estimadores

Los estimadores son una combinación lineal de los valores de las variables exógenas. El estimador y el parámetro dependerán en función de la distribución de la perturbación aleatoria. Es decir, la diferencia entre el estimador y el parámetro será una función lineal de los términos de error del modelo. En media: Coinciden el estimador y el parámetro. Varianza: en la práctica se utilizan aquellos estimadores que tengan la varianza más pequeña, es decir, los más eficientes entre todos los estimadores lineales posibles, y que sean insesgados. Es decir, buscamos estimadores ELIO.

  1. Insesgadez.
  2. Eficiencia: Se aplica la cuota de Cramer-Rao.
  3. Consistencia.

Contraste

Para ver si la información estadística es la adecuada, si el modelo está bien especificado, y si es adecuado para el uso, contamos con una serie de estadísticos:

A. Contraste de Significación Estadística

  • Contraste individual significación económica: (signos) (+) relación directa (-) relación inversa.
  • Contraste de significación individual (t-student) /Tc/>/Tt/.
  • Contraste de significación conjunta F-Snedecor. Fc >Ft.
  • Bondad en el ajuste.

B. Medidas de Bondad a Priori

Compara los valores reales y los valores estimados.

C. Validación del Modelo a Posteriori

Estudia la capacidad del modelo para describir la realidad y para predecir fuera del intervalo muestral el comportamiento de la variable endógena.

D. Contraste de Hipótesis

Analiza las posibles distorsiones que pueden provocar la equivocada aceptación inicial de ciertas hipótesis.

Utilización

  • Predicción: Aplicación de un modelo econométrico estimado, para predecir valores cuantitativos de ciertas variables fuera de la muestra de datos realmente observados.
  • Análisis estructural: Es el uso del modelo econométrico estimado, para efectuar la medición cuantitativa de relaciones económicas. También permite la comparación de teorías contrarias sobre un mismo fenómeno.
  • Evaluación de políticas: es el manejo de un modelo econométrico para elegir entre políticas alternativas.

Entradas relacionadas: