Análisis Estadístico de Datos con R
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en español con un tamaño de 5,54 KB
Lectura de Datos
registrobib <- read.table("regbib2.txt", header = TRUE, sep = "", dec = ",")
Análisis Exploratorio de Datos
str(variable)
attach(variable)
table(variable)
Cálculo de Frecuencias y Estadísticas Descriptivas
tablabib <- table(variable)
nuevavariable <- table(variable)
F.Relativas <- prop.table(nuevavariable)
cumsum(tablabib)
cumsum(prop.table(tablabib))
Cálculo de Intervalos
nclass <- nclass.Sturges(variable) # Calcula k
range(VARIABLE) # Obtiene el rango
amplitud = K/rango
limites <- seq(liminferior, limitesuperior, by = amplitud)
Creación de la Tabla de Intervalos
tabla_intervalos <- table(cut(variable, breaks = limites, include.lowest = TRUE, dig.lab = 4))
NUEVAVARIABLE2 <- tabla_intervalos
Medidas de Tendencia Central
mediaBibliotecas <- mean(BIBLIOTECAS) # Calcula la media
medianaBibliotecas <- median(BIBLIOTECAS) # Calcula la mediana
summary(BIBLIOTECAS) # Resumen estadístico
quantile(BIBLIOTECAS) # Calcula los cuartiles
quantile(BIBLIOTECAS, 0.90) # Calcula el percentil 90
quantile(BIBLIOTECAS, probs = c(0.20, 0.40, 0.85, 0.90)) # Calcula varios percentiles
Medidas de Dispersión
recorridoBibliotecas <- diff(range(BIBLIOTECAS)) # Calcula el recorrido
rangoIntercBibliotecas <- IQR(BIBLIOTECAS) # Calcula el rango intercuartílico
varBibliotecas <- var(BIBLIOTECAS) # Calcula la varianza muestral
varBibliotecasCorregida <- varBibliotecas * (length(BIBLIOTECAS) - 1) / length(BIBLIOTECAS) # Calcula la varianza corregida
desvBibliotecas <- sd(BIBLIOTECAS) # Calcula la desviación estándar muestral
desvBibliotecasCorregida <- sqrt(varBibliotecasCorregida) # Calcula la desviación estándar corregida
coefVariacionPearsonBibliotecas <- desvBibliotecas / abs(mediaBibliotecas) # Calcula el coeficiente de variación de Pearson
y3 <- (BIBLIOTECAS - mediaBibliotecas)^3 # Calcula la tercera potencia de la desviación de la media
coefAsimetriaBibliotecas <- 1 / (desvBibliotecas^3) * mean(y3) # Calcula el coeficiente de asimetría
y4 <- (BIBLIOTECAS - mediaBibliotecas)^4 # Calcula la cuarta potencia de la desviación de la media
coefApuntamientoBibliotecas <- 1 / (desvBibliotecas^4) * mean(y4) - 3 # Calcula el coeficiente de apuntamiento
Estadística Descriptiva Bivariante
tablaIO <- table(ideologia, opinion)
addmargins(tablaIO) # Agrega márgenes a la tabla
prop.table(tablaIO) # Calcula las frecuencias relativas
addmargins(prop.table(tablaIO)) # Calcula las frecuencias relativas marginales
prop.table(tablaIO, 1) # Frecuencias relativas condicionadas por filas
prop.table(tablaIO, 2) # Frecuencias relativas condicionadas por columnas
Tabla de Doble Entrada
data = matrix(c(450, 164, 65, 56, 100, 825), ncol = 3, byrow = FALSE)
rownames(data) = c('Usuario', 'No Usuario')
colnames(data) = c('Lector asiduo', 'Lector ocasional', 'Sin hábitos de lectura')
data = as.table(data)
data
chisq.test(ideologia, opinion) # Calcula el coeficiente de contingencia de Pearson
CoefContingIO <- sqrt(7.2142 / (7.2143 + 40))
CoefContingIO
- Si se acerca a 0, mayor independencia entre las variables.
- Si se acerca a su valor máximo, mayor grado de asociación.
summary(data)
Relación entre Variables Cualitativas
poblacion <- c(12.7, 8.5, 8.2, 7.5, 6.7, 11.5, 10.1, 5.9, 4.4, 4.5)
prestamos <- c(86, 48.8, 51.3, 47.3, 34.9, 94.7, 77, 39.9, 18.1, 36)
plot(poblacion, prestamos)
Coeficiente de Relación Lineal de Pearson
cor(poblacion, prestamos) # Coeficiente de correlación
Recta de Regresión
lm(prestamos ~ poblacion) # Modelo de regresión lineal
Diagrama de Dispersión
plot(poblacion, prestamos)
abline(lm(prestamos ~ poblacion)) # Agrega la recta de regresión al gráfico
Gráficos
sectores = pie(tabcom, main = "Distribución de los municipios en comarcas")
barplot(cumsum(tablabib), main = "Cantidad de bibliotecas por municipios", sub = "Gráfico de frecuencias absolutas acumuladas", xlab = "Bibliotecas", ylab = "Municipios", col = "red")
boxplot(TITULOS, main = "Total de títulos disponibles por municipio")
Distribución de Probabilidad
dbinom(3, 3, 0.5) # Probabilidad de 3 cruces
dbinom(2, 3, 0.5) # Probabilidad de 2 cruces
1 - pbinom(1, 3, 0.5) # Probabilidad de más de una cruz
pbinom(2, 3, 0.5) - pbinom(0, 3, 0.5) # Probabilidad de 1 o 2 cruces
dbinom(12, 50, 0.45)
pbinom(18, 50, 0.45)