Análisis Factorial: Interpretación y Aplicación Práctica
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en español con un tamaño de 4,75 KB
1. Indicar la hipótesis nula y la alternativa del contraste de Bartlett. ¿Qué sugiere el test de Bartlett en este caso?
H0: la matriz de correlaciones es la matriz identidad
H1: la matriz de correlaciones no es la matriz identidad
Mirando en la tabla “KMO and Bartlett’s Test”, podemos rechazar con fuerza la hipótesis nula, pues su p-valor es del 0%. Aceptamos entonces que la matriz de correlaciones no es la matriz identidad.
2. A la vista del resultado del KMO, ¿qué puede afirmar acerca del grado de adecuación de un análisis factorial para estos datos?
Mirando en la tabla “KMO and Bartlett’s Test”, observamos que su valor KMO es de 0,661, lo que significa que el análisis factorial tiene un grado de adecuación medio (0,5 < KMO < 0,7, entonces grado medio de adecuación).
3. ¿Es razonable proponer una solución de 2 factores? Justifique la respuesta.
Mirando en la tabla “Total Variance Explained”, y siguiendo el criterio de la varianza explicada (consistente en seleccionar el número de componentes necesario para explicar una proporción suficiente de la varianza, no inferior al 70%), podemos afirmar que sí, es razonable proponer una solución con 2 factores, puesto que tan solo el primer componente ya explica el 56,225% de la variabilidad total y si, además, contamos con el segundo componente, se logra explicar un 85,586%. No seguiremos añadiendo o teniendo en cuenta más componentes (que en realidad no explican gran cantidad de la variabilidad), y así podremos simplificar el análisis.
Si seguimos el criterio, para determinar el número de componentes, del gráfico de sedimentación o de “codo” (consistente en buscar un punto a partir del cual los valores propios son aproximadamente iguales), observamos claramente que se podría contar con 2 ó 3 componentes. En este caso escogeremos 2, para simplificar el análisis.
4. ¿Qué porcentaje de la varianza de la variable gasto medio por hogar queda recogido con la solución factorial propuesta?
Como la Comunalidad no cambia al aplicar la rotación, miramos en la tabla “Communnalities” y buscamos la comunalidad de la variable “Gasto medio por hogar (euros)”. Entonces, el porcentaje de la varianza de esta variable explicada por el conjunto de los factores es del 79,6%.
5. Indique el objetivo de la rotación. ¿Qué elementos cambian con la rotación?
Si nos quedáramos con la matriz factorial directa, podría ser muy complicado interpretar los factores, dado que muchas variables podrían saturarlo. Por ello, se debe transformar esta matriz, y así facilitar la interpretación final.
La Rotación es un procedimiento que, sin alterar la comunalidad de cada variable, cambia el porcentaje de varianza atribuible a cada factor, de manera que consigamos que cada variable sature sólo en un factor. Se trata, en este caso, de una Rotación Ortogonal, en la que los factores son independientes entre sí, se da lugar a una única matriz rotada y las cargas son correlaciones.
Los elementos que cambian con la rotación son únicamente el porcentaje de varianza atribuible a cada factor, lo demás sigue siendo exactamente igual.
6. Interpretar los factores extraídos.
Mirando en la tabla “Rotated Components Matrix”, podemos observar que el primer factor está correlacionado positivamente con “N.º de parados” (97,9%), “Profesores en enseñanza no superior” (99,2%), “Beneficiarios de prestaciones económicas por desempleo (97,3%), “Trabajadores afiliados al sistema de la SS en alta laboral” (96,8%), “Profesores universitarios” (96,3%), “Número de pensiones contributivas del sistema de la SS” (93,1%), “Beneficiarios de pensiones no contributivas de la SS” (90,7%). Se podría interpretar como un factor …………………….
Mientras que el segundo componente está correlacionado de forma positiva con las variables “Proporción de población de 16 y más años con estudios superiores” (94,5%), “Profesionales sanitarios colegiados por 100.000 habitantes” (91,9%), “Gasto medio por hogar (euros)” (86,7%) y con “Esperanza de vida al nacer” (72,6%); y de forma negativa con “Proporción de población de 16 y más años analfabeta/sin estudios” (-81,9%). Se podría interpretar como un factor del mayor gasto que se produce en los hogares cuanto más preparados, a nivel de estudios, estén sus miembros.
7. Comentar la posición de la Comunidad de Madrid y la Comunidad Andaluza en el plano formado por los dos factores extraídos.
Andalucía tiene mucho del factor 1 y Madrid tiene mucho del factor 2