Fundamentos del Modelo de Regresión Lineal: Estimación, Propiedades y Contrastes

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 4,85 KB

Estimación fiable B1: E(u|x) = E(u)=0, Bo= E(y)-B1E(x)

Estimar parámetros: Bo=Y media -B1*X media,

B1=sxy cov/sx2= suma(x-media)2*(x-media)2/n-1 / suma(x-media)2/n-1

Residuo: U^= GPA-GPA^

R2: 1-SCR/STC, SCR= suma U2^, STC= suma(y-media)2, SEC=(y^-media)2, STC=SEC+SCR

Propiedades algebraicas de la regresión MCO

  1. Suma de residuos = 0
  2. Suma de productos de las variables observables x y residuo = 0, suma x*u^=0 o 1/n-1 suma x*u=0
  3. La recta de regresión MCO pasa por el punto (xmedia,ymedia) o (xmedia1, xmedia2,ymedia)
  4. Media de las variables ajustadas = media de las variables observables, ymedia=y^media o 1/n suma y=ymedia
  5. Covarianza muestral entre variables ajustadas y residuos =0 o 1/n-1 suma y^u^=0

Bondad de ajuste: Capacidad de la variable independiente para explicar la dependiente (STC, SEC, SCR)

Insesgadez MCO

RLS1: Linealidad en los parámetros: y=Bo+B1x+u

RLS2: Muestra aleatoria (x,y) : i=1,2..

RLS3: Media condicionada nula: E(u|x)=0

RLS4: Variación muestral de la variable independiente (si falla RLS4 no podemos calcular el estimador)

RLS1-RLS4 son insesgados: E(Bo^)=E(Bo). Si falla RLS3 son sesgados. La mejor estimación tiene menor varianza.

RLS5: Homoscedasticidad: var(u|x)= o2 (cuando depende de x, los errores son heteroscedásticos)

Var(u|x)=E(u2|x)-E(u|x)2 se puede escribir E(u2|x)=o2 o var(y|x)=o2

Var(B1^)= o2/suma (x-media)2 es igual a o2/(n-1)s2x

Var (Bo^)= o2 1/n suma x2/suma (x-media)2 es igual a o2 media 2/(n-1)s2x

Mayor varianza del término de error = mayor var(B1^), difícil de estimar. Mayor var(x) = menor var(B1^), poca dispersión en x + difícil estimar B1

Mayor n = menor var B1^. EER (error estándar de regresión) o^=raíz o2^, se(B1^)=o^/raíz (n-1)s2x, se(Bo^)=o^raiz media2/(n-1)s2x

B1: Elasticidad de las ventas(y) respecto al precio

Correlación: sxy/sx*sy, grande = multicolinealidad, error estándar grande, mal especificado

Modelo de Regresión Lineal Múltiple (RLM)

RLM1: Linealidad en los parámetros: y=Bo+B1x1…

RLM2: Muestreo aleatorio (x1,xk) i=1,2…

RLM3: Media condicionada nula: E(u|x1 xk…)=0

RLM4: No colinealidad perfecta (no relación lineal entre variables, ej: fem+masc=1)

RLM5: Homoscedasticidad: var(u|x1,xk)=o2

RLM1-RLM4: Gauss-Markov. Si RLM5 no se cumple, aún podemos calcular var (Bj^)=o2/(n-1)s2x(1-R2j)

Inclusión de variable irrelevante: Quitar una no incumple RLM1-RLM4, aumenta el sesgo.

Omitir variable: Correlación + B2+= sesgo + infraestima el primer modelo, menor. Correlación – B2+= S –

Correlación – B2 -=sesgo + sobrestima. Correlación + B2 - = sesgo – (fuese menor que el que aparece)

RLM6: Normalidad: u_N(0,o2) independiente de x. RLM1-RLM6: modelo lineal clásico + eficiente

Contrastes de Hipótesis

Estadístico de contraste: t=Bj^-Bj/se(Bj^)_tn-k-1 bajo HO

Región crítica: (tn-k-1,ángulo, infinito) (Fq,n-k-1, ángulo,infinito) Rechazar si t>tn-k-1,ángulo/2 (valor crítico) O DENTRO

p-valor: Nivel más bajo para rechazar, prob(|tn-k-1|>t)

ICU (Intervalo de Confianza): (Bj^-tn-k-1, ángulo/2 *se(Bj^). Si t no está dentro, rechazar. Si hay otro dato, reparametrizamos y sustituimos en la función y calculamos el ICU para el nuevo dato.

Rendimiento: Resta las 2 ecuaciones. Óptimo: derivadas=0

Significatividad global: HO=B1=B2=B3=0 (ninguna variable afecta a la dependiente)

F=STC-SCR/K/SCR/N-K-1 esto es F=1-(SCR/STC)/K/(SCR/STC)/N-K-1 esto es F=R2/K/1-R2/N-K-1 Fq,n-k-1

1 variable con el mismo efecto que otra: B2=B3. Reparametrizar B2=@+B3, sustituir y nuevo contraste.

Ni una variable afecta ni la otra: B2=B3=0, modelo restringido. F=SCRr-SCRnr/Q/SCRnr/N-K-1

Rechazar si F>Fq,n-k-1,ángulo

1 variable compensa a la otra o no hay diferencia: B2+B3=0. Reparametrizar.

F=t2 F función R2= R2nr-R2r/Q/1-R2nr/N-K-1

Female: Diferencia media entre salario de mujer y hombre.

Región 2: Diferencia salarial entre individuos que viven en la región 2 y los que viven en la región 1.

Estadístico de Chow: F=(SCRr-(SCR1+SCR2)/K+1/SCR1+SCR2/N-2*(K+1) _ FK+1,N-2*(K+1)

No white: Diferencia salarial entre hombres no blancos y hombres blancos.

Entradas relacionadas: