Errores de Muestreo y Métodos Estadísticos

Enviado por Programa Chuletas y clasificado en Matemáticas

Escrito el en español con un tamaño de 4,98 KB

Errores en el Muestreo y Técnicas Estadísticas

Nunca sabremos con certeza el verdadero valor de cualquier parámetro poblacional. Una fuente posible de error procede del hecho de que no observamos toda la población, y lo llamamos error de muestreo, de azar o de estimación. Este tipo de error es inevitable, ya que siempre habrá diferencia entre los valores medios de la muestra y los valores medios de la población. La magnitud de este error depende del tamaño de la muestra (a mayor tamaño de muestra menor error) y de la dispersión o desviación estándar del estimador (a mayor dispersión mayor error).

La Estadística estudia de qué forma se puede tratar ese tipo de error o, al menos, cómo se puede incorporar en el proceso de inferencia (intervalos de confianza, nivel de significación, etc.). Sin embargo, hay otras posibles fuentes de error que no pueden ser tratadas de la misma forma. Los llamaremos errores ajenos al muestreo y algunos de ellos son:

  • Definición incorrecta de la población de referencia.
  • Respuestas imprecisas o falsas. Normalmente proceden de falta de claridad en el cuestionario y de la formulación de preguntas delicadas para el entrevistado.
  • Falta de respuesta. Este hecho puede producir estimaciones sesgadas, ya que los que respondieron pueden no representar fielmente a la población. Por eso, en este caso, conviene analizar las características de los que no lo hicieron (posible sesgo) y compararlas con los que sí lo hicieron, para ver si son homogéneos o no ambos grupos.

Tipos de Muestreo

Existen diferentes métodos de muestreo, cada uno con sus propias características y aplicaciones:

Aleatorio Simple

Se selecciona una muestra de tamaño n de una población de N unidades. Cada elemento tiene una probabilidad de inclusión igual y conocida de n/N. Es sencillo y de fácil comprensión, pero requiere que se posea de antemano un listado completo de toda la población, lo cual puede resultar costoso.

Sistemático

Se necesita un listado de los N elementos de la población. Tras determinar el tamaño muestral n, se define un valor p = N/n. Se elige un número aleatorio, k, entre 1 y p (k = arranque aleatorio) y se seleccionan los elementos de la lista que ocupan los lugares k, k+p, k+2p, .... Es fácil de aplicar. Cuando la población está ordenada siguiendo una tendencia conocida, asegura una cobertura de unidades de todos los tipos. Si la constante de muestreo está asociada con el fenómeno de interés, las estimaciones obtenidas a partir de la muestra pueden contener sesgo de selección.

Estratificado

En ciertas ocasiones resultará conveniente estratificar la muestra según ciertas variables de interés. Para ello debemos conocer la composición estratificada de la población. Tiende a asegurar que la muestra represente adecuadamente a la población en función de las variables seleccionadas, proporcionando estimaciones más precisas. Su objetivo es conseguir una muestra lo más semejante posible a la población en lo referente a las variables estratificadoras. Se ha de conocer la distribución en la población de las variables utilizadas para la estratificación.

Conglomerados - Etapas

Se seleccionan aleatoriamente cierto número de conglomerados y se investigan todos los elementos de cada uno de ellos. El muestreo por etapas es una generalización, que va de más grandes a más pequeños. Se realizan varias fases de muestreo sucesivas. Es muy eficiente cuando la población es muy grande y dispersa. No es preciso tener un listado de toda la población, sólo de las unidades últimas de muestreo, lo que reduce el coste. Sin embargo, el error estándar es mayor que en el muestreo aleatorio simple o estratificado, y el cálculo del error estándar es complejo.

Contrastes de Hipótesis

  1. Contrastes de aleatoriedad. Contraste de rachas
  2. Contrastes de localización
    1. Contraste del signo
      1. Localización de una población (mediana)
      2. Diferencia de medianas para parejas de datos relacionados
    2. Contraste del rango signado (Wilcoxon)
      1. Localización de una población (mediana)
      2. Diferencia de medianas para parejas de datos relacionados
    3. Contraste de Wilcoxon de la suma de rangos (dos muestras independientes). Contraste de Mann-Whitney
    4. Contraste de Kruskal-Wallis (más de dos muestras independientes)

P-valor

El p-valor, o nivel de significación empírico del contraste, se obtiene a partir del valor observado para el estadístico del contraste en la muestra extraída de la población. Se define como la probabilidad de obtener un valor igual o más extremo al observado, dado que la hipótesis nula es cierta. Al ser una probabilidad, se cumple que:

Si p-valor < α, se rechaza H0.

Entradas relacionadas: