Conceptos Básicos de Estadística Descriptiva: Población, Variables y Gráficos
Enviado por Programa Chuletas y clasificado en Matemáticas
Escrito el en español con un tamaño de 7,74 KB
Conceptos Básicos de Estadística Descriptiva
Definiciones Fundamentales
- Población: Conjunto de personas del que se hace el estudio.
- Elementos: Personas o cosas que forman parte de la población.
- Variables: El tema del que se hace el estudio.
- Muestra: Parte de la población sobre la que se hace el estudio para luego generalizar los resultados.
- Variables cuantitativas: Se expresan en valores numéricos.
- Discretas: Se expresan en valores numéricos enteros, no admiten decimales.
- Continuas: Se expresan en valores numéricos, admiten decimales.
- Variables atributos: Se expresan en valores textuales.
- Ordenables: Admiten un orden.
- No ordenables: No admiten orden.
- Fuentes primarias: Fondos que dan información de primera mano (entrevistas y encuestas).
- Fuentes secundarias: Son reflexiones de las primarias (censos, padrones como INE e IBESTAT).
Tablas Estadísticas
Para realizar un estudio, primero se han de obtener los datos y después recopilarlos en una tabla.
- Frecuencia absoluta: Número de veces que aparece en la muestra un mismo valor de la variable, es decir, la cantidad de esta variable que tiene la muestra.
- Frecuencia relativa: Resultado de dividir la frecuencia absoluta entre el tamaño de la muestra.
- Frecuencia absoluta acumulada: Es el número de veces que ha aparecido en la muestra un valor menor o igual, se acumulan los valores y se van sumando.
Cuanto más grande sea el número de intervalos, más detalles de información tendremos, si es demasiado grande puede dificultar la lectura, y si es demasiado pequeño se pierde mucha información. Cuando el número de valores de la variable es muy elevado, hay que juntar los datos en grupos. Si el número es reducido, se puede hacer la tabla directamente.
Gráficos
Para hacer un gráfico correctamente, los ejes deben empezar de 0, los espacios entre cada intervalo deben ser iguales, el tipo de gráfico debe ser el adecuado teniendo en cuenta la información que queremos representar.
- Gráfico de columnas: No hace falta que los intervalos estén de manera continua en el eje horizontal ya que, a diferencia del histograma, los valores no son continuos. La altura de los rectángulos dependerá del valor de la variable.
- Gráfico de barras: Es similar al gráfico de columnas, pero los ejes están girados. Los rectángulos están dispuestos de manera horizontal.
- Gráfico de líneas: Consiste en una serie de puntos situados donde coinciden los valores de cada eje. Estos puntos se juntan con una línea.
- Gráfico de proporciones: Se utiliza para representar porcentajes de la frecuencia de las variables.
- Gráfico de dispersión: Muestra la dispersión entre las observaciones realizadas. Deben ser variables cuantitativas continuas.
Medidas de Centralización
- Media aritmética: Sumatorio de todos los valores de la variable dividido entre el tamaño de la muestra.
- Mediana: Valor central de una serie de datos ordenados de forma creciente o decreciente.
- Moda: Valor de la variable que tiene más frecuencia absoluta, lo que más se repite.
- Cuartil: Cada uno de los tres puntos que divide la frecuencia en cuatro partes iguales.
Medidas de Dispersión
- Desviación media: Consiste en encontrar la diferencia entre cada uno de los valores de la variable, y dividir entre el tamaño de la muestra.
- Varianza: Consiste en elevar al cuadrado las desviaciones para eliminar los signos negativos.
- Desviación típica: Es la raíz cuadrada de la varianza.
- Coeficiente de variación: Consiste en dividir la desviación típica entre la media aritmética. El resultado se expresa en tanto por ciento.
- Curva de Lorenz: Es una representación gráfica que muestra si una distribución de frecuencias tiene mucha concentración o no. Se hace una diagonal recta partiendo desde el punto 0. Si la curva está más cerca de la diagonal, querrá decir que hay menos concentración, y viceversa.
Asociaciones Bivariables
- Variable independiente: Aquella variable que no se ve modificada por la otra.
- Variable dependiente: Aquella que se ve afectada por el comportamiento de la variable independiente.
- Forma: Se puede conseguir trasladando los valores de las dos variables a un sistema de coordenadas. Si los puntos se sitúan sobre una recta o curva, es que hay relación entre las dos variables.
- Fuerza: Nos indica si la relación entre dos variables es importante o no.
- Coeficiente de correlación: Determina la fuerza de una relación y el sentido. Será positiva si el sentido es ascendente y será negativa si el sentido es descendente.
- Coeficiente de Spearman: Permite calibrar la correlación entre dos variables a partir de los valores ordinales. Los valores reales son sustituidos por números ordinales para organizarlos mejor.
- Coeficiente de Pearson: Permite calibrar la correlación entre dos variables partiendo de sus valores reales.
Introducción al Análisis Multivariante
- Análisis factorial: Es una técnica que pretende una reducción de la dimensión de datos. Tiene como objetivo buscar el mínimo de dimensión de datos con el máximo de información contenida en los datos. Este puede ser exploratorio o confirmatorio.
- Confirmatorio:
- Matriz de información espacial: Cada variable tiene unos valores que le permiten situarse en un espacio, como unos ejes de coordenadas.
- Matriz de correlaciones: Estudia el grado de conexión entre dos variables.
- Matriz factorial, extracción de factores: Indica la relación entre los factores y las variables.
- Rotación de factores: Pretende hacer girar los ejes de coordenadas que representan los factores, para conseguir que se aproximen al máximo a las variables. Intenta que mejore la correlación entre variables y factores.
- Interpretación de factores: Pretende conocer el contenido de cada factor, estudiar su composición.
- Exploratorio:
- Selección de variables: No elegir las variables de forma aleatoria, puede ser positivo factorizar previamente las variables.
- Medidas de similitud o de distancia: Define proximidad, y su tipo viene dado por la escala de medida de variables.
- Algoritmo de agrupación, métodos jerárquicos: Consiste en procesos de agrupación o desagrupación.
- Confirmatorio: