Relación entre variables: análisis de correlación y regresión

Enviado por Programa Chuletas y clasificado en Matemáticas

Escrito el en español con un tamaño de 8,48 KB

Relación entre variables: cuando se quiere saber cómo se da la relación entre variables cuantitativas, el análisis de correlación y regresión es el más adecuado. Relación entre variables es la posibilidad de conocer cómo el comportamiento de las categorías de la variable independiente incide en el comportamiento de la variable dependiente. Análisis lineal: mide si al aumentar los valores de la variable independiente aumentan también los valores de la dependiente en una relación directa o si a medida que aumenta una disminuirá la otra, relación lineal inversa. La linealidad está determinada por la forma en que se vinculan las variables, lo cual se mide por la ecuación de los mínimos cuadrados. Objetivos del análisis de regresión: predecir los valores que asumirá la variable dependiente a partir de valores de la independiente. Objetivo de correlación simple: conocer la intensidad o fuerza de esa relación y el sentido de la misma. Es decir, intención de covarianza: relación sistemática entre dos variables en la cual el cambio en una de ellas implica un cambio correspondiente en la otra. Si el signo del coeficiente R es +, las variables varían en la misma dirección (por ejemplo, cuanto más se invierte en publicidad, mayor es la suba en las ventas). Si es -, el incremento de una variable produce el decremento de la otra (si se aumenta el precio de un bien, la demanda bajará). El R de Pearson solo puede calcularse con variables cuantitativas. Análisis de regresión lineal: con este análisis se puede predecir la evolución de la variable dependiente a partir de la variable independiente. Cuanto más fuerte sea esa dependencia, será más precisa esa predicción. Con un diagrama de dispersión podemos representar un espacio de dos dimensiones donde, a partir del conocimiento de una variable independiente, se puede predecir la evolución de la dependiente.

Mínimos cuadrados ordinarios: este método se expresa a través de la llamada ecuación de la recta. Los valores a y b son constantes a partir de los cuales se construye la recta que mejor representa la relación de asociación entre las variables y que permitirá realizar la estimación. No es posible realizar una predicción perfecta a menos que la asociación entre variables sea perfecta también, cosa que sucede raramente. Estamos ante una regresión lineal múltiple que comprende una sola variable dependiente y dos o más variables independientes cuando contemplamos más de una variable independiente y medimos el efecto de cada una de ellas sobre la variable dependiente. La relación se presenta como lineal, pero no se puede graficar como una recta por no ser con dos variables ni tres. El análisis se lleva a cabo a través de la ecuación. Análisis de regresión múltiple puede servir para uno o una combinación de dos propósitos básicos: 1) pronosticar el nivel de la variable dependiente con base en determinados niveles de las variables independientes, 2) entender la relación entre las variables independientes y la dependiente. Regresión y correlación: hay una vinculación estrecha entre el modelo de regresión y el análisis de correlación. La capacidad de predecir de una ecuación de regresión será muy débil si el valor de r se aproxima mucho a 0. La R explica la variación de la variable dependiente que es explicada por la variación en las variables independientes en % del R. Cuando se necesita incluir variables independientes de escala nominal como género, estado civil, ocupación en la regresión múltiple, es posible crear variables ficticias o dummies para este propósito. Las variables DICOTÓMICAS de escala nominal se pueden transformar en variables ficticias codificando un valor (por ejemplo, mujer 0 y el otro por ejemplo hombre como 1). Para asumir más de dos valores D1, D2 y D3

Problemas de interpretación: se pueden encontrar ciertos problemas por el uso y la interpretación de los resultados del análisis de regresión múltiple: se pueden resumir estos en 1) Colinealidad, 2) Causalidad, 3) Escala de coeficientes y 4) tamaño de la muestra.

1) Suposición de que las variables independientes no están correlacionadas. 2) Aunque el análisis de regresión puede mostrar que las variables están relacionadas, no puede comprobar la causalidad. Solo se pueden confirmar por otros medios (orden de tiempo apropiado, eliminación de otros posibles factores causales), etc. Hay que desarrollar una base lógica o teórica fuerte para respaldar la idea de que existe una relación causal entre las variables independientes y la dependiente. 3) Las magnitudes de los coeficientes de regresión asociados a variables independientes se pueden comparar directamente solo si se escalan en las mismas unidades o si los datos se estandarizan. 4) El valor R2 está influido por el número de variables de pronóstico en relación con el tamaño de la muestra.



Plan de muestreo: 5 etapas: 1) Definir la población objetivo, 2) Determinar el marco de muestreo, 3) Seleccionar técnicas de muestreo, 4) Determinar el tamaño de la muestra, 5) Ejecutar el proceso de muestreo. 1) elementos u objetos que poseen la información buscada acerca de la cual se realizan deducciones. Implica la definición del problema en un enunciado preciso de quién debe incluirse en la muestra y quién no. Debe definirse en elementos (objeto del cual se desea investigación), por ejemplo, hombre o mujer jefe de familia responsable, unidad de muestreo (elemento o unidad que contiene el elemento disponible para la selección en alguna etapa del proceso), por ejemplo, hogares, y extensión de tiempo (límite geográfico, lapso de consideración), por ejemplo, zona metropolitana ciudad de Rcia año 20162) es la representación de los elementos de una población. Instrucciones para identificar a la población objetivo3) teniendo en cuenta los objetivos de investigación, precisión deseada, marco de tiempo, conocimiento de la población objetivo, alcance de investigación, puede ser Muestra probabilística: todos los elementos tienen una probabilidad para ser seleccionados, la obtención de las unidades de análisis es al azar, se puede calcular intervalos de confianza. El objetivo es hacer una inferencia acerca de la población con base en la información contenida en la muestra. Principales técnicas de muestreo probabilísticos: aleatorio simple, sistemático, estratificado, por agrupamientosMuestra no probabilística: se desconoce la probabilidad de seleccionar cada unidad de muestreo, se desconoce el porcentaje de error. Basándose en algún juicio intuitivo o conocimiento del investigador. Principales técnicas de muestreo no probabilístico: por conveniencia, por juicio, por cuota, muestreo de bola de nieve.



4- Se refiere al número de elementos que se incluirán en el estudio. Para hacerlo correctamente, hay que tener en cuenta la variabilidad de la característica de la población que se investiga, el nivel de confianza deseado en los cálculos, la precisión requerida. 5- Especificación detallada de cómo se lleva a cabo las decisiones de diseño de muestreo con relación a: la población objetivo, el arco de muestreo, las unidades y la técnica como el tamaño de la muestra.

Entradas relacionadas: