Ejercicios Resueltos de Análisis Multivariante: Factorial, Clúster y Discriminante
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en español con un tamaño de 14,71 KB
Ejercicios Resueltos de Análisis Multivariante
Análisis Factorial
- El test de esfericidad de Bartlett tenderá a rechazarse si: R: El determinante de la matriz de correlaciones tiende a cero.
- En el modelo factorial, se llama especificidad de una variable explicativa a: R: La proporción de la varianza explicada por el factor específico.
- Dado un conjunto de p variables explicativas y un número q de factores comunes, se tiene que en el modelo factorial la matriz de cargas factoriales es de dimensión: R: p x q
- El test de esfericidad de Bartlett tenderá a no rechazarse si: R: El determinante de la matriz de correlaciones tiende a uno.
- En el modelo factorial, se llama comunalidad de una variable explicativa a: R: La proporción de la varianza explicada por los factores comunes.
- En el modelo factorial, la matriz de varianza de los factores específicos se puede describir como: R: Una matriz diagonal heterocedástica.
- Sea el modelo factorial x = Bf + e, donde x es el vector de variables explicativas, B es la matriz de cargas factoriales, f es el vector de factores comunes y e es el vector de factores específicos. Indique a continuación, cuál de los siguientes enunciados es falso: R: E(ff') = BB'
- En el modelo factorial, la matriz de varianza-covarianza se puede describir como: R: Una matriz simétrica no esférica con unos en la diagonal principal.
- En el modelo factorial, el producto interno de las cargas factoriales de una variable explicativa es igual a: R: Su comunalidad.
- Sea el modelo factorial x = Bf + e, donde x es el vector de variables explicativas, B es la matriz de cargas factoriales, f es el vector de factores comunes y e es el vector de factores específicos. Indique a continuación, cuál de los siguientes enunciados es falso: R: Var(fe') = I
- En el modelo de análisis factorial, la ecuación de descomposición de la matriz de varianza dice que: R: La matriz de varianza-covarianza es igual a la suma de la matriz de varianza común y la matriz de varianza específica.
- En el modelo de análisis factorial, la ecuación de descomposición de la matriz de varianza dice que: R: La matriz de varianza-covarianza es igual a la suma de la matriz de varianza común y la matriz de varianza específica.
- En el modelo factorial, la matriz de varianza-covarianza de los factores comunes se puede describir como: R: Una matriz simétrica y esférica con unos en la diagonal principal.
- La hipótesis nula del test de esfericidad de Bartlett es: R: La matriz de correlaciones es igual a la matriz identidad.
- El test de esfericidad de Bartlett tenderá a rechazarse si: R: El determinante de la matriz de correlaciones tiende a cero.
- Dado un conjunto de p variables explicativas y un número q de factores comunes, se tiene que en el modelo factorial la matriz de varianza-covarianza de los factores específicos es de dimensión: R: p x p
- En el modelo factorial, se llama comunalidad de una variable explicativa a: R: La proporción de la varianza explicada por los factores comunes.
- Se conoce como Varimax a: R: El método de rotación factorial ortogonal basado en la maximización de las cargas factoriales.
Análisis Clúster
- Si en la distancia de Minkowski el parámetro m de exponente es igual a 2, entonces dicha medida es igual a: R: La distancia euclídea.
- El modelo jerárquico que tiende a generar grupos más grandes al inicio y grupos más pequeños al final es: R: Enlace simple (Simple Linkage).
- Si en un modelo de agrupamiento con variables categóricas, el número de ceros y unos es desbalanceado en favor de los unos, entonces las medidas de concordancia recomendables son: R: Coeficiente de Russel-Rao o Coeficiente de Jaccard.
- Para evaluar cuál es el número óptimo de grupos en el análisis de clúster, el Coeficiente Omega de Calinsky-Harabasz debe preferirse al Seudo F de Calinsky-Harabasz, dado que: R: El criterio de razón de varianza (CRV) tiende a disminuir a medida que aumenta el número de grupos.
- El modelo jerárquico en el que la distancia entre dos clústeres se calcula con los vectores de las dos observaciones más lejanas entre los dos grupos se conoce como: R: Enlace completo (Complete Linkage).
- Si la inversa de la matriz de varianza-covarianza es igual a la identidad, entonces la medida de distancia de Mahalanobis es igual a: R: La distancia euclídea.
- Para evaluar cuál es el número óptimo de grupos en el análisis de clúster, el Coeficiente Omega de Calinsky-Harabasz debe preferirse al Seudo F de Calinsky-Harabasz, dado que: R: El criterio de razón de varianza (CRV) tiende a disminuir a medida que aumenta el número de grupos.
- El modelo jerárquico en el que la distancia entre dos clústeres se calcula con los vectores de los promedios de las distancias de todos los pares de observaciones entre los dos grupos se conoce como: R: Enlace promedio (Average Linkage).
- Si en la medida de distancia de Minkowski el parámetro m de exponente es igual a 1, entonces dicha medida es igual a: R: La distancia de Manhattan.
- En una matriz de distancia, los valores de las filas se replican en las columnas. Esto se debe a la propiedad de: R: Simetría.
- En un análisis de agrupamiento con variables categóricas y niveles balanceados, una medida adecuada para compararlos es: R: El coeficiente de concordancia simple.
- Si en un modelo de agrupamiento con variables categóricas, el número de ceros y unos es desbalanceado en favor de los unos, entonces las medidas de concordancia recomendables son: R: Coeficiente de Russel-Rao o Coeficiente de Jaccard.
- El modelo jerárquico en el que la distancia entre dos clústeres se calcula con los vectores promedios de cada grupo se conoce como: R: Enlace del centroide (Centroid Linkage).
- El modelo jerárquico en el que la distancia entre dos clústeres se calcula con los vectores de las dos observaciones más cercanas entre los dos grupos se conoce como: R: Enlace simple (Simple Linkage).
Análisis Discriminante
- Cuando se aplica un análisis discriminante lineal de Fisher y se desea saber qué tan buena es la capacidad predictiva del modelo, se debe proceder del siguiente modo: R: Generar una muestra de entrenamiento y una de testeo. Estimar luego el modelo con los datos de entrenamiento y aplicar seguidamente el modelo a los datos de testeo. Luego, con los resultados obtenidos en el testeo, se debe hacer una matriz de confusión entre las clasificaciones verdaderas y las predichas por el modelo en los datos de testeo. Luego, a partir de ello, se debe dividir la suma de las observaciones correctamente predichas entre el total, obteniendo así la medida correcta de precisión del modelo.
- De acuerdo a lo discutido en clases, el problema de optimización para encontrar la primera función discriminante se formaliza en: R: Maximizar la varianza entre grupos bajo la restricción de que la varianza intra-grupos sea igual a uno.
- Suponga un modelo discriminante lineal de dos grupos, donde di es la puntuación discriminante de la observación i, y C es el promedio de la puntuación discriminante evaluada en los centroides de los dos grupos. Suponga además que el valor de la función discriminante evaluada en el centroide del grupo uno es mayor que la función discriminante evaluada en el centroide del grupo dos. Entonces, indique ¿cuál de las siguientes reglas debe cumplirse para saber que la observación pertenece al grupo dos?: R: di < C
- Indique en cuál de los siguientes casos no es aplicable el modelo discriminante lineal de Fisher: R: Queremos saber si existen diferencias en un set de variables de desarrollo de los países, según su religión predominante.
- Sea di la puntuación discriminante, W la matriz de varianza-covarianza intra-grupos y E la matriz de varianza-covarianza entre-grupos, y v el vector columna de coeficientes de la puntuación discriminante. Indique a continuación, ¿cuál de los siguientes enunciados es verdadero? (Nótese que las alternativas de respuesta no son idénticas: la comilla francesa indica la operación de transposición): R: Var(di) = v'Wv + v'Ev
- Indique en cuál de los siguientes casos no es aplicable el modelo discriminante lineal de Fisher: R: Queremos saber si existen diferencias en un set de variables de desarrollo de los países, según su religión predominante.
- Dado un conjunto de p variables explicativas y un número q de factores comunes, se tiene que en el modelo factorial la matriz de cargas factoriales es de dimensión: R: p x q
- Suponga un modelo discriminante lineal de dos grupos, donde di es la puntuación discriminante de la observación i, y C es el promedio de la puntuación discriminante evaluada en los centroides de los dos grupos. Suponga además que el valor de la función discriminante evaluada en el centroide del grupo uno es mayor que la función discriminante evaluada en el centroide del grupo dos. Entonces, indique ¿cuál de las siguientes reglas debe cumplirse para saber que la observación pertenece al grupo dos?: R: di < C
- Se puede demostrar que la función f(v) = [v'Wv]-1v'Ev es: R: Una función homogénea de grado cero.
- De acuerdo al modelo discriminante lineal de Fisher, indique cuál de los siguientes enunciados es falso: R: El estimador de la matriz de varianza-covarianza de la puntuación discriminante es igual a: (1/n)X'X, donde X es la matriz de información y n es el tamaño de la muestra.
- Sea un modelo discriminante lineal de Fisher para dos grupos. Sean dos funciones con la estructura: FI = aI'xi - cI y FII = aII'xi - cII, donde cI y cII son términos constantes, mientras que aI y aII son vectores de coeficientes, tales que satisfacen la siguiente ecuación: FII - FI = di - C, donde C es el umbral de corte de la puntuación discriminante. Indique a continuación, ¿cuál de los siguientes enunciados es verdadero?: R: Si FI > FII, entonces di < C, y la observación i pertenece al grupo II.
- De acuerdo al modelo discriminante lineal de Fisher, indique cuál de los siguientes enunciados es falso: R: El estimador de la matriz de varianza-covarianza de la puntuación discriminante es igual a: (1/n)X'X, donde X es la matriz de información y n es el tamaño de la muestra.
- ¿Cuál de los siguientes enunciados no corresponde a un supuesto del modelo discriminante lineal de Fisher?: R: Las matrices de varianza-covarianza de las variables explicativas son esféricas.
- Indique en cuál de los siguientes casos no es aplicable el modelo discriminante lineal de Fisher: R: Queremos saber si existen diferencias en un set de variables de desarrollo de los países, según su religión predominante.
- Si al aplicar el modelo de análisis discriminante lineal de Fisher el número de observaciones es igual a n y el número de categorías de grupos es igual a k, entonces, ¿cuántos ejes discriminantes calculará R al aplicar la función lda()?: R: k-1