Estimación con Confianza: Intervalos de Confianza y Error Muestral

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 6,9 KB

Diseños Muestrales - Planteamientos Generales de la Estimación con Confianza: Error Muestral e Intervalos de Confianza

SUPUESTO:

Queremos estimar la edad media de inicio al consumo de alcohol en una población joven, y escogemos una muestra de 10 sujetos al azar. La edad media de inicio en esta muestra es 17 años. Pero sabemos que si cogiéramos otra muestra de 10 jóvenes al azar el valor de la edad media cambiaría, y si después extrajéramos otra muestra también al azar de otros diez jóvenes, también la media cambiaría. Entonces, ¿por qué podemos estimar la media de una población a partir de la media de una muestra?, ¿por qué es razonable hacerlo?, ¿qué confianza podemos tener al hacerlo?

1. Concepto de Distribución Muestral

Siguiendo con el ejemplo anterior, obtenemos 1.000 muestras aleatorias, cada una de ellas de 10 personas, es decir de tamaño 10. Y para cada una de ellas calculamos la media de edad (estadístico muestral).

  • Muestra aleatoria simple de n=10 y hallamos su media de edad x=….
  • Muestra aleatoria simple de n=10 y hallamos su media de edad x=…..
  • Y así sucesivamente, hasta llegar a la muestra 1.000.

Lo que conseguimos es la distribución muestral de las medias, que no es otra cosa que una distribución de frecuencias del estadístico, o dicho de otro modo, en cuántas muestras de esas 1.000 aparecen valores diferentes de la media. Supongamos que la distribución de frecuencias queda así:

Edad media
(valores diferentes que ha tomado la media en esas 1.000 muestras)
Frecuencia absoluta
(número de muestras en las que la media ha tomado ese valor)
14100
15150
16500
17250
N =1.000

En definitiva, la distribución muestral de un estadístico es la distribución de los valores tomados por él (en nuestro ejemplo la edad media de inicio al consumo del alcohol), en todas las muestras posibles aleatorias y de igual tamaño de la población. La distribución muestral nos da la proporción de veces que aparece un determinado valor de una media después de muchas repeticiones.

Conviene recordar que cuando hablamos de probabilidad estamos hablando de la proporción de veces que ocurre un determinado suceso después de muchas repeticiones.

Estrictamente hablando, la distribución muestral es la distribución que aparecería si examináramos todas las muestras aleatorias posibles de tamaño 10 de nuestra población.

2. Ley de los Grandes Números y Teorema del Límite Central

Si nosotros tomáramos en realidad todas estas muestras posibles, y dibujáramos el histograma de esa distribución muestral y nos fijásemos en su forma, centro y dispersión, nos daríamos cuenta de lo siguiente:

  • En cuanto a su forma, ¡parece normal! La distribución de la media de muchas muestras tiene una distribución muy cercana a la normal, es decir, forma en campana de Gauss (Figura 4)
  • La media de esas 1.000 medias muestrales queda muy cerca de la media de la población de la que se han obtenido esas muestras, prácticamente es la misma.

Esta es la Ley de los Grandes Números, que dice, que: si obtenemos observaciones al azar de cualquier población, a medida que aumenta el número de observaciones, la media de los valores observados se acerca mucho a la media poblacional (FIGURA 2)

  • La desviación típica de la distribución muestral de medias es menor que la desviación típica de la población.

A esta desviación típica la llamamos error típico, y no es otra cosa que el promedio de las diferencias o desviaciones de la media de cada una de esas muestras posibles respecto a la media de la distribución muestral, o lo que es lo mismo, respecto a la media de todas las muestras juntas.

Como sabemos por la Ley de los Grandes Números que la media de la distribución muestral se aproxima mucho a la media de la población, podríamos decir que el error típico no es otra cosa que el promedio de las diferencias o desviaciones de las medias de las muestras respecto a la media poblacional de la que han sido extraídas. Sabiendo el error típico sabemos en cuanto se separa, si mucho o poco, la media de nuestra muestra (que es una de las muchas muestras posibles que podemos obtener) de la media de la población.

Y este error típico es pequeño. Es decir, que al extraer todas las muestras posibles del mismo tamaño de una población, lo que se separarán las medias de esas muestras posibles de la media de la población que queremos estimar será poco. Es decir, nuestra estimación será buena, nos aproximaremos mucho a la media de la población (Figura 6)

Acabamos de formular el Teorema del Límite Central, que dice que: cuando la muestra es suficientemente grande, la distribución de la media es aproximadamente normal, con media igual a la media de la población y desviación típica menor a la desviación típica de la población.

Daros cuenta que para que la Ley de los Grandes números y el Teorema del Límite Central se cumplan, necesitamos muestras grandes y aleatorias.

Se expresa así: la distribución muestral de medias (estadístico) es aproximadamente N(µ, ∂/√n), donde:

  • N significa Normal,
  • µ Media de la población (parámetro), y
  • ∂/√n es el Error Típico o Desviación típica de la distribución muestral. ∂ es la varianza de la población.

3. Estimación con Confianza: Nivel de Confianza, Error Muestral o de Estimación, e Intervalos de Confianza

Utilizamos la distribución muestral para calcular las probabilidades relacionadas con la estimación a partir del estadístico que observamos en una sola muestra, sabiendo que una probabilidad es una proporción que aparece después de muchas repeticiones.

Conocemos que en una distribución de forma normal, el 95% de los casos tienen una puntuación que está comprendida entre la media de la distribución y +- casi 2 veces la desviación típica (exactamente 1,96).

El dibujo está expresado en unidades z, es decir, unidades de desviación típica respecto a la media, donde el valor 0 se corresponde con la media de la distribución y el resto de valores expresa las unidades de desviación típica por debajo o por encima de la media en la que se encuentran las puntuaciones.

Entradas relacionadas: