Análisis Estadístico de Regresión: R2, Pruebas de Hipótesis y Evaluación del Modelo
Enviado por Programa Chuletas y clasificado en Diseño e Ingeniería
Escrito el en español con un tamaño de 4,35 KB
Análisis Estadístico de Regresión
Ejercicio 5: Coeficiente de Determinación (R²)
R² = ρ²xy
Donde:
- SCE = ∑ŷ²; ŷ = β̂.x₁ => ŷ² = β̂²₁.x²₁
- ρxy = cov(x,y) / (desx . desy) = ∑xy / √(∑x²₁.∑ŷ²₁)
- R² = SCE / SCT = β̂² . [∑(x-ẋ)² / ∑(y-ӯ)²] => Dividiendo ambos miembros por n => β̂² . [Var(x) * Var(y)]
Además:
β̂² = [∑xy / ∑x²]² = [(∑xy / n) / (∑x² / n)]² = [cov(x,y) / var(x)]² = [cov(x,y)² / var(x)²] . var(x) / var(y) => cov(x,y)² / (var(x) . var(y)) = [cov(x,y) / (σ(x) . σ(y))]² => R² = ρ²xy
Pruebas de Hipótesis y Significancia
- T: N-k-1. Ho: βo es significativamente diferente de 0 y, por lo tanto, la variable x es relevante para el modelo. Contribuye significativamente al modelo.
- R²: Porcentaje de variabilidad de la variable dependiente respecto de las independientes. Indica el grado de relación entre Y y los regresores. Determina la calidad del modelo para replicar los resultados y la proporción de variación de los resultados que puede explicarse por el modelo.
- R²A (R² Ajustado): (1 - ((n-1) / (n-k-1)) . (1 - R²)). Ho: β1 = 0. Mide el porcentaje de variación de la variable dependiente, teniendo en cuenta el número de variables incluidas en el modelo. Mide el incremento de R² cuando se incluye un nuevo regresor.
- F: (k; n-k-1). Ho: Ao = Ai. Indica si las variables aportan información significativa al modelo en forma conjunta. Rho: Hay estrecha relación entre la recta observada y la recta estimada.
- T.Var.Adic (Prueba T para Variables Adicionales): ((R²q - R²k) / (q - k)) / ((1 - R²q) / (n - q - 1)). Ho: β1 = 0. Determina si aquello que incrementa el R² es significativo.
- T.Chow (Prueba de Chow): Ho: αi = βi. ((SCRr - SCRnr) / (k + 1)) / (SCRnr / (N - 2k - 2)). Indica si los coeficientes en dos regresiones lineales en dos sets de datos son iguales.
- Test Res Lin (Test de Restricciones Lineales): ((SCRr - SCRnr) / m) / (SCRnr / (N - k - 1)). Ho: Algún β = otro β. Rho: Me quedo con el modelo No restringido.
- Test-W (Prueba de Wald): nR²aux, k gl (número de regresores de la regresión auxiliar). Ho: σ1 = σi. Si NRHo: no hay patrón de comportamiento de las variables independientes que generen heterocedasticidad en la muestra. La muestra me da indicios de un comportamiento homocedástico.
Evaluación del Modelo
A) Análisis de Significación Individual (T-statistic) (prob): Para comprobar si el verdadero valor del parámetro es 0 o no. Miramos “prob” que es la probabilidad de rechazar h0 cuando es cierta. Por convención usamos 95% de confianza, por lo que una “prob” debajo de 0.05 indica dicha probabilidad de equivocarme cuando rechazo h0. LA PROBABILIDAD ES 0, POR LO QUE ACEPTO LA VALIDEZ DE TODAS LAS VARIABLES ESPECIFICADAS.
B) Análisis de Significación Conjunta (F-statistic y R² cuadrático): La F plantea la hipótesis de que todos los parámetros del modelo, excepto la ordenada al origen, realmente valen 0. Observando el “Prob (f-stat)” podemos rechazar con un 100% de seguridad la h0. SABEMOS CON CERTEZA QUE AL MENOS ALGUNO DE LOS PARÁMETROS ES DISTINTO DE 0.
C) Coeficiente de Determinación: Del R² PODEMOS DECIR QUE SOMOS CAPACES DE RECOGER MÁS DEL 94% DE LA VARIACIÓN DE Y A PARTIR DE LA INFORMACIÓN SUMINISTRADA. EL RESTO QUEDA EN ELEMENTOS QUE NO PODEMOS EXPLICAR CON ESTE MODELO. Con el R² ajustado se puede intuir si existe algún problema de omisión de variables relevantes en el modelo. Si la diferencia entre R² y R²A es relativamente elevada, hay indicios de problemas de especificación, faltan variables relevantes en el modelo. EN NUESTRO MODELO PRÁCTICAMENTE NO HAY DIFERENCIA, NO PUEDE INFERIRSE PROBLEMAS DE MALA ESPECIFICACIÓN CON ESTE INDICADOR.