Análisis factorial ACP: Método multivariante para obtener información significativa
Enviado por Programa Chuletas y clasificado en Matemáticas
Escrito el en español con un tamaño de 15,1 KB
Análisis factorial ACP: Método multivariante descriptivo de interdependencia. Permite una pérdida relativa de información para obtener ganancia en significación, dimensiones latentes, conceptos económicos estandarizados y ausencia de multicolinealidad. Desarrollo de mapas de posicionamiento. Son variables métricas de razón con escala Likert o dif semántico, luego se tipifican. Tiene que tener al menos 5 casos y las correlaciones significativas deben ser > 0,3. Pasos:
1- Cumple los 3 requisitos: - Determinante < 0,1, KMO > 0,7 (suficiente, bueno, excelente), Barlett < 0,05 (rechaza Ho, si se cumple). Si no se cumple, se mira MSA (correlaciones antiimagen) > 0,5 se analiza, si es < 0,5 se quita del análisis. 2- Mirar test de Kaiser (varianza total explicada, rotación) y se ve el % de factores que explican el % acumulado de la varianza total. Variables tipificadas. 3- En la matriz componentes rotados se cogen los valores mayores para saber dónde incluir cada variable/factor. Si en una fila hay 2, producen sinergias. 4- En estadística descriptiva se mira las medias de cada factor, sabiendo que la más elevada tendrá una ventaja respecto a las demás. ¿Mejor posición en el factor 3? Se hace el % del factor * la valoración de los rotados. ¿Cuál de estos está mejor posicionado? Sumar valores del posicionamiento de X. 5- En matriz correlaciones marcar > 0,3. Cuanto más correlaciones sean elevadas, va a salir mejor factoriano, mayor cantidad de información, menos factores mejor resultado.
Discriminante: Método explicativo causal. Han de ser variables exhaustivas, disjuntas y definitivas a priori. Ausencia de multicolinealidad entre variables causales. Mínimo 20 casos. Variable predictiva Xi sigue distribución normal (la causa previa a la consecuencia). La variable Y será dependiente -> variable no métrica nominal o de razón si se recodifica con la ordinal se pierde información. La variable X será la independiente -> variable métrica de razón. Pasos:
1- Comprobar Test de M. de Box: Ho > 0,05 no se rechaza Ho, se cumple que las matrices de covarianzas intragrupos han de ser iguales o muy similares para grupos de población. 2- Mirar Lambda de Wilks: < 0,05 se rechaza Ho, quiere decir que tiene diferencia estadísticamente significativa y tiene relación la variable. Se sube a la tabla autovalores (correlaciones canónicas) la que tienen relación se eleva a 2 y lo que sale será la función discriminante (capacidad explicativa) > 0,3 está bien. 3- En Resultado de Clasificación: debajo de la tabla se ve la capacidad predictiva global, el % debajo de la tabla > 80% o > 50% aleatorios. 4- En la tabla coeficientes discriminante canónicos, como son 3 tipos de aloja habrá N-1 función discriminante. Se coge Factor 1 y 2 = F.D.1 = número * nombre factor + .... 5- Los centroides (es el valor de representatividad de las puntuaciones discriminantes de cada grupo) los positivos están por encima de la media. 6- Coeficiente de la función de clasificación: sumar columnas 1, 2, la más alta es el suceso más probable. 6- Matriz de estructura: indica el grado de asociación entre X y las funciones discriminantes, se cogen los valores más altos.
Preguntas: - Según su formulación: 1) Abiertas: no respuestas preformuladas. 2) Cerradas: prefijadas, pueden ser dicotómicas o múltiples: unirespuesta/multirespuesta. - Según el tipo de información: 1) De control: verificar que las personas responden la verdad. 2) En batería: preguntas sobre el mismo tema y se disponen en bloques. 3) Filtro: segmentar muestra para realizar preguntas distintas, hacer disyuntivas. 4) Indirecta: útiles ante temas delicados. 5) Sobre hábitos de compra o de consumo: actos concretos realizados por el propio entrevistado. 6) Sobre motivaciones: analiza la causa subyacente que explican un hábito de compra. 7) Sobre evaluaciones: opiniones o valoraciones sobre cualquier tema u objeto.
ANOVA: Método explicativo causal, mide la relación de dependencia de la variable Y respecto a la variable X. Elementos disjuntos, no existencia de interacción. La variable dependiente es Y -> variable métrica de razón y la variable independiente sería variable no métrica o de intervalo. Pasos:
1- Mirar tabla T – Levene o Bartlett (análisis de homocedasticidad): Ho > 0,05, si cumple la condición de homogeneidad de las varianzas. 2- Mirar tabla de efectos inter-sujetos: p-valor es < 0,05 se rechaza Ho, por lo tanto, tiene diferencia estadísticamente significativa, lo que quiere decir que existe relación causal de X sobre Y. 3- Se mira estadística descriptiva: ver valor de las medias y la más alta es la que más influye sobre el resto. 4- Tabla de efectos inter-sujetos: mirar bondad de ajuste (eta al cuadrado) debajo de la tabla y si es > 0,3 es un buen resultado, interesan valores altos. Esta sería la capacidad de explicar la variabilidad total de la variable dependiente. 5- Potencia observada: muestra la probabilidad de que el test F detecte diferencias entre los niveles de cada variable (poder de la prueba). Valor mínimo > 0,8 (poder de prueba).
MANOVA: Método explicativo causal, siempre se analizan varias variables dependientes a explicar. Pasos:
1- Mirar tabla T – Levene o Bartlett (análisis de homocedasticidad): Ho > 0,05, si cumple la condición de homogeneidad de las varianzas. 2- Mirar contrastes multivariados: (Pillai o Wilks): sig. < 0,05, la causa analizada si tiene influencias estadísticamente significativas sobre las variables a explicar. 3- Tabla de efectos inter-sujetos: mirar bondad de ajuste (eta al cuadrado) debajo de la tabla y si es > 0,3 es un buen resultado, interesan valores altos. Esta sería la capacidad de explicar la variabilidad total de la variable dependiente. 4- Potencia observada: muestra la probabilidad de que el test F detecte diferencias entre los niveles de cada variable (poder de la prueba). Valor mínimo > 0,8 (poder de prueba). 5- Mirar tabla de efectos inter-sujetos: p-valor es < 0,05 se rechaza Ho, por lo que si influye sobre la variable Y y explica datos de la media.
Método Probabilístico: 1) Muestreo aleatorio simple: sorteo de las unidades muestrales. 2) Muestreo sistemático: un único sorteo. 3) Muestreo estratificado simple: selecciona mismo número de elementos en cada estrato. 4) Muestreo estratificado proporcional: censo, reparto proporcional. 5) Muestreo por conglomerado/grupos: selección de elementos que componen la muestra, es costoso (exhaustivos y homogéneos). 6) Muestreo por áreas/polietápico. 7) Muestreo por rutas aleatorias. Método NO Probabilístico: 1) Muestreo por juicios: criterio de los entrevistados. 2) Muestreo por cuotas: selección de una proporción de unidades muestrales. 3) Muestreo bola de nieve/en cadena: universos pequeños, localizar unidades muestrales a las que pedimos que contesten. 4) Muestreo por conveniencia, causal o accidental: el investigador elige las unidades muestrales a su conveniencia. Tamaño de la muestra: A) Si > 100.000 E. de % n = ((k^2*P*Q) / e^). De Medias: n = ((k^2*s^2) / e^2). B) Si < 100.000 E. de % n = ((k^2*N*P*Q) / ((e^2*(n-1))+(k^2*p*q))). De Medias: n = ((k^2*n*s^2) / ((e^2*n)+(k^2*s^2))).
Error de muestra: A) Si > 100.000 E. de % e = k*raíz((P*Q)/n). De Medias e = ((k*s)/raíz(n)). B) Si > 100.000 De % e = k*raíz(((N-n)*P*Q)/(N-1)*n). De Medias: e = k*s*raíz((N-n)/(N-n)). 68% K = 1; 95% K = 1,96; 95,5% K = 2; 99% K = 3. N - tamaño de la población, n - tamaño de la muestra, P - % de la población, Q = 1-P - proporción de la población, s - cuasidesviación típica, P = Q desconocido 0,5.
5) Bivariable: Conclusión del estudio para extrapolar o inferir a la población. Contraste de hipótesis: 8 Pasos. Moda-Nominal y respuestas múltiples. Mediana (moda)-ordinal. Media (mediana)-métrica. 1) Formulación Test de Levene de Ho: p-valor > 0,05 no se rechaza, se cumple homocedasticidad, Distribución Normal. Se rechaza Ho: Hi 0,01<><0,05 = nivel de significación 5%. 2) Elegir la prueba estadística adecuada en función de: objetivo, diseño (independiente o relacionadas), escala de medida. ¿Sigue distribución Normal? - Si, entonces Test paramétrico (dependiente/relacionado, variable métrica cuantitativa, escala Likert/dif semántico). 1 - M. independiente son T para 2 grupos y ANOVA (Test de Levene: A. Homocedasticidad, variable métrica y no). 2 - M. relacionados: (T-Student: A. Normalidad): Shapiro: muestra < 50, Kolmogorov: muestra > 50. No sigue Distribución normal: Test no paramétrico, independiente (variables no métricas, cualitativas): 2 Grupos: Prueba U de Mann-Whitney: la media mayor posición más alta. + 2 Grupos: H de Kruskal-Wallis, la media mayor 1º orden de prelación después de las demás. En las variables métricas, mirar correlación: Siempre rechazar Ho: < 0,05 si hay relación lineal y detecta el grado y sentido de la relación medidas escalares. Coeficiente de correlación de Pearson: Test paramétrico. Coeficiente de rango de Spearman: Test no paramétrico y métrica pero no están normalmente distribuidas. Coeficiente t de Kendall: Test no paramétrico, variable no métrica ordinal/métrica recodificada en rango. Rango: 0.8-1 fuerte, 0.5-0.7 media, 0-0.49 débil, -0.5-0.7 muy débil, -0.8-1 No correlación. En las variables no métricas nominales, coeficiente de asociación: rechazar Ho: < 0,05 existe asociación. Coeficiente Phi para variables nominales dicotómicas. Coeficiente de Cramer para tabla de contingencia de variables nominales no dicotómicas. ¿La variable X se distribuye de forma normal? A. Normalidad. ¿Existe diferencia de X con Y? A. Normalidad y homocedasticidad.
¿Existe relación de causalidad entre las variables X e Y? Al ser una variable no métrica nominal el nivel de satisfacción y una variable no métrica ordinal la imagen de la marca, realizaría un análisis con una tabla de contingencia y coeficiente de asociación, ya que las variables a analizar son variables no métricas Xi y Xj. Pasos: 1- Mirar tabla chi-cuadrado donde se ve si el análisis es fiable y robusto. Si no lo es, se debería hacer una recodificación para que ese análisis sea fiable. Si es fiable, seguimos el análisis y miramos p-valor, si este es < 0,05 quiere decir que se rechaza Ho y que sí hay relación entre las variables analizadas independientes, distribución normal. 2- En la tabla de contingencia se miran los residuos y si son > 1,96 (95%) o > 2.58 (99%) significa que hay diferencias estadísticamente significativas y que están relacionadas las variables analizadas. Su signo nos indica si hay más o menos casos de los debidos. En la tabla de contingencia podemos ver cuál de los factores está mejor valorada que las demás. 3- Se iría ahora a la tabla de medidas simétricas para mirar la asociación lineal. Se mira p-valor, si es < 0,05 es que tiene relación con la variable analizada, iremos a valor y si es ><0,03 es débil, >0,03><0,05 moderada, >0,05><0,07 alta y sino muy alta.
AEDEMO: Asociación Española de Estudios de Mercado, Marketing. ANEIMO: Asociación Nacional de Empresas de Investigación de Mercado y Opinión Pública. ESOMAR: Asociación del ámbito Europeo. ¿Por qué es necesaria la Investigación Comercial? Porque las empresas trabajan en mercados más amplios y difíciles (globalización), trabajan con más productos diferentes, se encuentran con un entorno más complejo de analizar y la información se desvirtúa a medida que circula en un sentido u otro. Paradoja de la información comercial: cada vez existe más información disponible a coste más pequeño y cada vez hay más información parcial o falsa. Conclusiones: Se tiende a sobrevalorar lo que gusta a cada persona (efecto espejo), las personas evalúan el futuro a partir de las experiencias personales, efecto del falso consenso: la gente tiende a pensar que sus gustos son más frecuentes de lo que son en realidad. Núcleo de la investigación comercial: - Información sobre entorno: oportunidades, amenazas, Macroentorno, microentorno. - Información para marketing estratégico: segmentar mercado, posicionamiento de un producto. - Información para marketing operativo: gama de productos, política de distribución, decisiones de precio, comunicación comercial. SIM (Sistema de Información de Marketing): recogida de información para tomar decisiones. Tiene 4 subsistemas: Datos internos, inteligencia de marketing, investigación comercial, apoyo a las decisiones de marketing. ¿Qué es investigación comercial? Búsqueda de información para su análisis e interpretación para identificar y solucionar problemas y aprovechar oportunidades. Tiene 4 Caracteres: Investigación sistemática, carácter objetivo, elemento informativo (ser relevante, eficiente y eficaz). Finalidad: posibilitar la toma de decisiones por los responsables de marketing. Sesgos: personas que lleven una vida metódica, colaboran personas con menos de 40 años, cuanto mayor precio sea menor propensión a cooperar en los paneles, mayor cooperación clases medias, se colabora más con productos de compra planificada que con compra. ¿Cómo se mide las variables económicas? - De forma cualitativa/no métrica (se lee mediante letra): * Nominal: salario, raza, sector, color de ojos, estado civil, profesión, país... * Ordinal: asignar un número para ordenar los datos (calidad de servicio, escolaridad, satisfacción, orden de mérito). - De forma cuantitativa/métrica: * De intervalo: igual que las no métricas, reúne 2 requisitos: 1) diferencia entre valores es de escala constante y tiene significado, 2) el cero arbitrario no hay ausencia total de cantidad (estatura, salario, ventas producidas, volumen de ventas, clif examen). * De razón: igual que de intervalo pero el cero es absoluto, si indica ausencia total (edad, número de hijos, gastos mensuales, ingresos, peso, talla). Tipos de escalas: - Stapel: No valor neutro (solo son variables no métricas ordinales). - Likert: Son variables no métricas ordinales y pueden ser también de razón. - Dif. Semántico: igual que Likert pero más bipolar. - Escala de preferencia: sumas constantes. - Escala de ordenación: comparaciones múltiples. - Escala de elección: comparaciones pareadas. n*(n-1)/2.