Análisis de Varianza (ANOVA) para Comparar Grupos: Guía Completa
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en español con un tamaño de 7,58 KB
Análisis de Varianza (ANOVA) para Comparar Grupos: Guía Completa
Introducción
El análisis de varianza (ANOVA) es una técnica estadística poderosa que se utiliza para comparar las medias de dos o más grupos. Es una herramienta esencial para determinar si existen diferencias significativas entre los grupos o si las diferencias observadas se deben al azar.
1. Tamaño del Efecto
Antes de realizar un ANOVA, es útil tener una idea del tamaño del efecto que se espera encontrar. Esto nos ayudará a determinar si las diferencias entre los grupos son significativas desde un punto de vista práctico.
1.1. Criterios Orientadores para Valorar la Magnitud
Disponemos de criterios orientadores para valorar la magnitud:
- d = .20: Diferencia pequeña
- d = .50: Diferencia moderada
- d = .80: Diferencia grande
Podemos estimar el % de sujetos del grupo con media más baja superados por el sujeto medio del grupo con media más alta (que en su propio grupo superaría al 50%).
(aplicación de la distribución normal).
2. Análisis de Varianza (ANOVA) con Muestras Independientes
2.1. Preguntas Clave
Al realizar un ANOVA con muestras independientes, debemos responder a dos preguntas fundamentales:
- ¿Podemos afirmar que existe una diferencia entre las medias de tres o más grupos (en una variable cuantitativa) mayor de lo que podríamos esperar por simple azar? ¿Existe una diferencia estadísticamente significativa? ¿Sus diferencias no se explican por la variabilidad normal de muestras distintas?
- ¿Cuál es la magnitud de la diferencia? ¿Grande, moderada, pequeña...?
2.2. Respuestas a las Preguntas
2.2.1. Primera Pregunta: ¿Diferencia Significativa?
El ANOVA nos ayuda a determinar si las diferencias entre las medias de los grupos son significativas o si se deben al azar. Para ello, compara la varianza entre los grupos con la varianza dentro de los grupos.
- Hipótesis Nula: No hay diferencia entre las medias de los grupos. Las diferencias observadas se deben al azar.
- Hipótesis Alternativa: Existe una diferencia significativa entre las medias de los grupos.
El análisis de varianza comprueba si hay diferencia entre dos varianzas (o variaciones):
- La varianza que hay entre los sujetos dentro de cada uno de los grupos que estamos comparando, las diferencias que hay entre ellos.
- La varianza entre las medias de los grupos, las diferencias que hay entre esas medias (utilizando las medias de los grupos que estamos comparando como si se tratara de datos de varios sujetos).
Si las medias entre sí difieren más que los sujetos entre sí, podemos concluir que:
- Las medias de los grupos son distintas.
- Las muestras proceden de poblaciones distintas con diferencia media.
- Existen diferencias en la variable dependiente entre los grupos.
Ejemplo:
Tenemos dos grupos, uno de gigantes y otro de enanos. Cada grupo tiene su media en altura; la media de los gigantes es mayor que la media de los enanos. Dentro de cada grupo también hay diferencias; no todos los enanos son igualmente bajos ni todos los gigantes son igualmente altos (siempre hay diferencias, son diferencias normales).
¿Cuál sería nuestra conclusión si comprobamos que la diferencia entre las medias de los gigantes y los enanos es más o menos igual a las diferencias que podemos encontrar entre los sujetos dentro de cada grupo?
Pues sencillamente que no tenemos enanos ni gigantes, la hipótesis es falsa, y por lo que respecta a altura, todos pertenecen al mismo grupo, a la misma población.
Lo que hacemos es comprobar si hay o no diferencias superiores a lo normal entre las medias de varias muestras, considerando como diferencias normales las que podemos encontrar entre los sujetos del mismo grupo.
Expresado de otra manera: la diversidad o variación que encontramos dentro de los grupos (expresada por la varianza dentro de los grupos) es la diversidad normal, aleatoria -> lo normal es que no todos los sujetos de una muestra sean idénticos en una determinada característica.
2.2.2. Segunda Pregunta: ¿Magnitud de la Diferencia?
Una vez que se ha determinado que existe una diferencia significativa entre los grupos, es importante cuantificar la magnitud de esa diferencia.
1. Calculamos la F de Snedecor
La F de Snedecor es una razón, un cociente entre la varianza entre los grupos y la varianza dentro los grupos (y que consideramos que es la variabilidad normal).
-Fórmula
-Es decir, calculamos si la varianza entre los grupos es igual a la varianza dentro de los grupos:
- Si la razón F es igual a 1, las dos varianzas son iguales, no difieren.
- En la medida en que la varianza del numerador sea mayor que la del denominador, el cociente irá siendo mayor que 1.
-Las tablas correspondientes nos indican la probabilidad de que se dé casualmente el cociente F en el caso de no diferencia entre las medias de las poblaciones representadas por esas muestras -> el valor que se daría por azar el 5% de las veces o el 1% de las veces.
2. Interpretamos el resultado
- Si nuestra F es muy probable (p > .05): la diferencia entre las dos varianzas está dentro de lo normal y probable en el caso de que no hay diferencias entre los grupos (aceptamos la Hipótesis Nula de no diferencia entre los grupos).
- Si nuestra F es poco probable (pse escapa de lo normal, es muy improbable que haya sido una casualidad (no aceptamos la Hipótesis Nula, nuestra conclusión es que sí hay diferencias entre los grupos).
-Cuanto mayor valor de F, mayor es la seguridad para afirmar la diferencia entre los grupos, más se separa la varianza entre los grupos de la varianza normal (la de dentro de los grupos).
3. REQUISITOS PARA LA APLICACIÓN DE T DE STUDENT Y
ANOVA (PRUEBAS PARAMÉTRICAS DE DIFERENCIA DE
GRUPOS)
-Sólo consideramos estos requisitos cuando hacemos estadística inferencial (llegar a conclusiones acerca de las poblaciones representadas por las muestras)
-Si solo hacemos análisis descriptivo de nuestras muestras no es necesario que los tengamos en cuenta
- Muestras aleatorias.
- Tamaño muestral grande -> muestra total alrededor de 200.
- Variable dependiente cuantitativa.
- Tres o más grupos independientes de comparación (definidos por la variable independiente).
- Normalidad -> aunque una abundante investigación confirma que si no es así, el análisis no se invalida -> de hecho, las medias tienden a la distribución normal, aunque las poblaciones de dónde proceden no sean normales.
- Homogeneidad de varianzas -> que las varianzas de los grupos no difieran entre sí
•Si los tamaños de las muestras no difieren mucho y las muestras no
tienen menos de 20 sujetos, no debemos preocuparnos si las varianzas
difieren.
•Tomamos la decisión con la prueba de Levene: si p>0,05 mantenemos el
supuesto de homogeneidad de varianzas.
•Si p