Análisis Estadístico con Cluster, Regresión y Análisis Discriminante

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 3,92 KB

Análisis Estadístico

4. Grupos con Comportamientos Similares

Si existen grupos de algo con comportamientos similares respecto a alguna variable cuantitativa, se pueden caracterizar las peculiaridades de los segmentos resultantes.

El objetivo es agrupar personas con comportamientos similares según alguna variable cuantitativa.

Procedimiento Cluster

  • CLUSTER: Analizar, clasificar, conglomerados jerárquicos, insertar la variable que se quiere segmentar.
  • Guardar: rango de soluciones (mínimo 2, máximo 4).

Se crean nuevas variables (CLU2, CLU3, CLU4) que representan los clústeres.

Es preciso realizar los descriptivos de estos 3 factores para observar el tamaño y medias por grupo.

  • Analizar, estadísticos descriptivos, frecuencias, incluir los 3 CLUSTERS.

El % válido representa el peso de cada segmento dentro de cada clúster.

En este caso, se selecciona CLU2 (dos segmentos según el enunciado).

ANOVA

Realizar un ANOVA para ver las características de cada segmento. Analizar, comparar medias, ANOVA de un factor.

  • En factor, se introduce CLU2. En las dependientes, la variable utilizada para la segmentación.
  • Opciones: descriptivos, post hoc: DMS.

En las tablas del ANOVA, se observan los descriptivos (media y desviación típica de cada segmento). El ANOVA significativo indica diferencias de medias entre los segmentos.

Tabla Cruzada

Se puede realizar una tabla cruzada entre el clúster y variables cualitativas (sexo, género, etc.) para ver si hay diferencias entre los segmentos.

5. Variables que Explican una Variable Cuantitativa

Regresión

  • Regresión: Analizar, regresión, lineales.
  • En dependientes, la variable a analizar. En independientes, el resto de cuantitativas.
  • Estadísticos: estimaciones, ajustes del modelo, cambio en R cuadrado y diagnóstico de colinealidad.

R cuadrado: Explica el % de la varianza. Entre 50% y 70% es ideal. Mayor de 30% es aceptable.

Coeficientes estandarizados Beta: Comprobar la significancia. Representan el peso de cada variable sobre la dependiente (positivo o negativo).

6. Determinación del Tipo de Cliente

Se busca una fórmula o algoritmo para clasificar clientes según ciertas variables y determinar si son estratégicos.

Análisis Discriminante

Se basa en el clúster previo. No se incluyen variables nominales (género, edad) ni la variable del clúster.

  • Analizar, clasificar, discriminante.
  • Variable de agrupación (dependiente): CLUSTER. Definir rangos (0,1).
  • Independientes: resto de variables cualitativas.
  • Estadísticos: medias, ANOVAS, M de Box, De Fisher, no estandarizados.
  • Clasificar: calcular según tamaños de grupos, tabla de resumen, grupos combinados y separados.
  • Guardar: pertenencia a grupos, puntuaciones y probabilidades.

Tabla prueba de igualdad de medias: Significancia, Lambda de Wilks y F para determinar candidatos a la función discriminante. Eliminar las no significativas.

Tabla coeficientes de la función discriminante: Construir la función (ej. D = -3,818 + 0,140*búsquedainfo + 0,116*afición...).

Tabla Lambda de Wilks: Significancia de la función discriminante. Si es significativa, los vectores son distintos y permite discriminar por grupos.

Tabla autovalores: Comprobar la R2 (intensidad de la relación). Correlación canónica > 0,3.

Tabla matriz estructura: Variables ordenadas por contribución. El signo indica el grupo.

Tabla resultados de la clasificación: Número de casos clasificados correctamente.

Entradas relacionadas: