Fundamentos del Modelo de Regresión Lineal: Estimación, Propiedades y Contrastes
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en español con un tamaño de 4,85 KB
Estimación fiable B1: E(u|x) = E(u)=0, Bo= E(y)-B1E(x)
Estimar parámetros: Bo=Y media -B1*X media,
B1=sxy cov/sx2= suma(x-media)2*(x-media)2/n-1 / suma(x-media)2/n-1
Residuo: U^= GPA-GPA^
R2: 1-SCR/STC, SCR= suma U2^, STC= suma(y-media)2, SEC=(y^-media)2, STC=SEC+SCR
Propiedades algebraicas de la regresión MCO
- Suma de residuos = 0
- Suma de productos de las variables observables x y residuo = 0, suma x*u^=0 o 1/n-1 suma x*u=0
- La recta de regresión MCO pasa por el punto (xmedia,ymedia) o (xmedia1, xmedia2,ymedia)
- Media de las variables ajustadas = media de las variables observables, ymedia=y^media o 1/n suma y=ymedia
- Covarianza muestral entre variables ajustadas y residuos =0 o 1/n-1 suma y^u^=0
Bondad de ajuste: Capacidad de la variable independiente para explicar la dependiente (STC, SEC, SCR)
Insesgadez MCO
RLS1: Linealidad en los parámetros: y=Bo+B1x+u
RLS2: Muestra aleatoria (x,y) : i=1,2..
RLS3: Media condicionada nula: E(u|x)=0
RLS4: Variación muestral de la variable independiente (si falla RLS4 no podemos calcular el estimador)
RLS1-RLS4 son insesgados: E(Bo^)=E(Bo). Si falla RLS3 son sesgados. La mejor estimación tiene menor varianza.
RLS5: Homoscedasticidad: var(u|x)= o2 (cuando depende de x, los errores son heteroscedásticos)
Var(u|x)=E(u2|x)-E(u|x)2 se puede escribir E(u2|x)=o2 o var(y|x)=o2
Var(B1^)= o2/suma (x-media)2 es igual a o2/(n-1)s2x
Var (Bo^)= o2 1/n suma x2/suma (x-media)2 es igual a o2 media 2/(n-1)s2x
Mayor varianza del término de error = mayor var(B1^), difícil de estimar. Mayor var(x) = menor var(B1^), poca dispersión en x + difícil estimar B1
Mayor n = menor var B1^. EER (error estándar de regresión) o^=raíz o2^, se(B1^)=o^/raíz (n-1)s2x, se(Bo^)=o^raiz media2/(n-1)s2x
B1: Elasticidad de las ventas(y) respecto al precio
Correlación: sxy/sx*sy, grande = multicolinealidad, error estándar grande, mal especificado
Modelo de Regresión Lineal Múltiple (RLM)
RLM1: Linealidad en los parámetros: y=Bo+B1x1…
RLM2: Muestreo aleatorio (x1,xk) i=1,2…
RLM3: Media condicionada nula: E(u|x1 xk…)=0
RLM4: No colinealidad perfecta (no relación lineal entre variables, ej: fem+masc=1)
RLM5: Homoscedasticidad: var(u|x1,xk)=o2
RLM1-RLM4: Gauss-Markov. Si RLM5 no se cumple, aún podemos calcular var (Bj^)=o2/(n-1)s2x(1-R2j)
Inclusión de variable irrelevante: Quitar una no incumple RLM1-RLM4, aumenta el sesgo.
Omitir variable: Correlación + B2+= sesgo + infraestima el primer modelo, menor. Correlación – B2+= S –
Correlación – B2 -=sesgo + sobrestima. Correlación + B2 - = sesgo – (fuese menor que el que aparece)
RLM6: Normalidad: u_N(0,o2) independiente de x. RLM1-RLM6: modelo lineal clásico + eficiente
Contrastes de Hipótesis
Estadístico de contraste: t=Bj^-Bj/se(Bj^)_tn-k-1 bajo HO
Región crítica: (tn-k-1,ángulo, infinito) (Fq,n-k-1, ángulo,infinito) Rechazar si t>tn-k-1,ángulo/2 (valor crítico) O DENTRO
p-valor: Nivel más bajo para rechazar, prob(|tn-k-1|>t)
ICU (Intervalo de Confianza): (Bj^-tn-k-1, ángulo/2 *se(Bj^). Si t no está dentro, rechazar. Si hay otro dato, reparametrizamos y sustituimos en la función y calculamos el ICU para el nuevo dato.
Rendimiento: Resta las 2 ecuaciones. Óptimo: derivadas=0
Significatividad global: HO=B1=B2=B3=0 (ninguna variable afecta a la dependiente)
F=STC-SCR/K/SCR/N-K-1 esto es F=1-(SCR/STC)/K/(SCR/STC)/N-K-1 esto es F=R2/K/1-R2/N-K-1 Fq,n-k-1
1 variable con el mismo efecto que otra: B2=B3. Reparametrizar B2=@+B3, sustituir y nuevo contraste.
Ni una variable afecta ni la otra: B2=B3=0, modelo restringido. F=SCRr-SCRnr/Q/SCRnr/N-K-1
Rechazar si F>Fq,n-k-1,ángulo
1 variable compensa a la otra o no hay diferencia: B2+B3=0. Reparametrizar.
F=t2 F función R2= R2nr-R2r/Q/1-R2nr/N-K-1
Female: Diferencia media entre salario de mujer y hombre.
Región 2: Diferencia salarial entre individuos que viven en la región 2 y los que viven en la región 1.
Estadístico de Chow: F=(SCRr-(SCR1+SCR2)/K+1/SCR1+SCR2/N-2*(K+1) _ FK+1,N-2*(K+1)
No white: Diferencia salarial entre hombres no blancos y hombres blancos.