Conceptos Estadísticos Esenciales: Mediana, Modelos Binomial y Normal, Tipificación y Contraste de Hipótesis

Enviado por Programa Chuletas y clasificado en Matemáticas

Escrito el en español con un tamaño de 7 KB

Conceptos Estadísticos Esenciales

7. Mediana: Definición y Diferencia con la Media Muestral

  • Definición: La mediana es el valor de la variable que divide a la muestra en dos partes iguales, de modo que el 50% de las observaciones se encuentran por debajo y el otro 50% por encima de este valor. Se representa por Me y corresponde con el segundo cuartil (Q2).
  • Diferencia con la media muestral: Ambas son estadísticos de posición central. La principal diferencia radica en que la media es sensible a valores extremos en la muestra, ya que toma en cuenta todos los valores para su cálculo. En cambio, la mediana se basa en las posiciones de los valores ordenados. Para representar una muestra, se considera la mediana si esta presenta valores atípicos, y la media si la muestra es homogénea (valores parecidos). Para determinar la homogeneidad, se compara la media con la mediana; si son iguales o muy parecidas, la muestra se considera homogénea.

8. Modelo Binomial: Concepto, Interpretación y Ejemplo

  • Concepto: También llamado de Bernoulli, se basa en que solo hay dos resultados posibles en el experimento: éxito (A) o fracaso (no A). La probabilidad del suceso A es constante en cada repetición del experimento, y los resultados son independientes entre sí. Normalmente, denotamos el éxito como 1 y el fracaso como 0. Las probabilidades son: P(x=1) = p y P(x=0) = 1-p, donde p es la probabilidad de éxito que permanece constante durante todas las veces que se realiza el experimento.
  • Ejemplo: Lanzar una moneda al aire 10 veces y determinar cuántas veces sale cara y cuántas cruz.

9. Modelo Normal: Interpretación de la Curva de Gauss y Ejemplo

Se dice que una variable aleatoria continua sigue una distribución normal de parámetros media y sigma si su función de densidad de probabilidad es campaniforme (curva de Gauss). Tiene las siguientes propiedades:

  • Es una curva positiva (hacia arriba).
  • El área debajo de la curva siempre es igual a 1.
  • La curva normal estándar es simétrica en el origen (x=0).
  • El punto de inflexión (donde cambia la curvatura) es x = ±1.
  • Las colas tienden a 0, pero nunca llegan a tocarlo.
  • La probabilidad de un punto siempre es 0; P(x=a) = 0.
  • La desviación típica es la diferencia entre el punto de inflexión y la media, por lo que el punto de inflexión estará dado por la desviación típica.
  • Ejemplo: Frecuencia cardíaca en ejercicio intenso.

10. Tipificación de Variables Estadísticas: Utilidad y Ejemplo

No tiene sentido tipificar todo tipo de variables estadísticas. Concretamente, no tiene sentido tipificar variables cualitativas. La tipificación trabaja con valores numéricos, específicamente con la media y la desviación típica.

La tipificación nos sirve para comparar valores entre distintas distribuciones cuando estas tienen medias y varianzas diferentes.

Ejemplo: Un jugador de voleibol A cadete mide 180 cm, siendo la media de su categoría 178 cm y su desviación típica 7 cm. Otro jugador B senior del mismo club mide 188 cm, siendo la media de su categoría 185 cm y su desviación típica 5 cm. Se desea saber qué jugador es más alto para su categoría y equipo.

Za = (180 - 178) / 7 = 0.28

Zb = (188 - 185) / 5 = 0.6

El jugador senior B es más alto en comparación con su categoría que el cadete A.

11. Diferencia entre Media Muestral y Media Poblacional

La media muestral y la poblacional son muy similares. Una diferencia es que la media muestral se representa con y la media poblacional con µ. La principal diferencia es que la media poblacional se trata del promedio de una población global y la muestral es el promedio de una pequeña parte, es decir, de una muestra de la población.

12. Contraste de Hipótesis Paramétrico: Concepto, Igualdad de Medias y Ejemplo

Es la técnica estadística que se utiliza para estudiar si una determinada afirmación acerca de cierto parámetro poblacional es confirmada o invalidada por los datos de una muestra extraída de dicha población.

Contraste:

  • Hipótesis nula (H0): Es la que se supone cierta y debe aceptarse salvo que los datos muestrales puedan refutarla. No debe ser rechazada sin una gran evidencia en contra.
  • Hipótesis alternativa (H1): Es la que niega la hipótesis nula. Los datos muestrales pueden mostrar evidencias a favor. No debe ser aceptada sin una gran evidencia a favor.

Para el contraste de igualdad de medias para dos muestras independientes, se utiliza la varianza y los cálculos internos se realizan de diferente forma.

13. Concepto de p-value y Ejemplo

El p-value es la probabilidad de que la diferencia que muestra el estadístico respecto de H0 se deba al azar propio de la distribución determinada por dicha hipótesis. Por convenio, se ha establecido rechazar la H0 cuando el p-value es menor al 0.05 (5%).

Ejemplo: Se desea saber si los jugadores de dos equipos de voleibol tienen el mismo porcentaje de grasa corporal, siendo la H0 que sí tienen el mismo porcentaje, y la H1 que no tienen el mismo porcentaje. Con los datos, se puede calcular el p-value.

14. Contraste de Hipótesis No Paramétrico: Concepto, Tipos y Ejemplo

Se dice que un contraste de hipótesis es no paramétrico si las hipótesis se refieren al modelo distribucional de los datos (no se está seguro de que siga una distribución normal).

Hay varios tipos:

  • Variable numérica:
    • Para una población y tamaño de muestra ≤ 50, se utiliza el test de Shapiro-Wilk.
    • Para una población y tamaño de muestra > 50, se utiliza el test de Kolmogorov-Smirnov.
    • Para dos poblaciones, se utiliza el test de Kolmogorov-Smirnov.
  • Variable cualitativa:
    • Para una población, se utiliza el test de Chi-cuadrado de Pearson.
    • Para dos poblaciones, dependiendo del tamaño de la tabla, se utiliza el test exacto de Fisher (tablas 2x2) o el test de Chi-cuadrado de Pearson (tablas de más de 2x2).

En todos estos modelos, se utiliza el p-value para tomar la decisión.

Ejemplo: Se desea saber si los jugadores de un club (con equipos masculinos y femeninos) fuman, teniendo en cuenta su sexo, y si estos datos siguen una distribución normal. En este caso, se realizaría el test del Chi-cuadrado de Pearson, ya que se tienen dos variables cualitativas que se quieren comparar en una tabla de 2x2.

Entradas relacionadas: