Análisis Estadístico de Datos con R

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 5,54 KB

Lectura de Datos

registrobib <- read.table("regbib2.txt", header = TRUE, sep = "", dec = ",")

Análisis Exploratorio de Datos

str(variable)

attach(variable)

table(variable)

Cálculo de Frecuencias y Estadísticas Descriptivas

tablabib <- table(variable)

nuevavariable <- table(variable)

F.Relativas <- prop.table(nuevavariable)

cumsum(tablabib)

cumsum(prop.table(tablabib))

Cálculo de Intervalos

nclass <- nclass.Sturges(variable) # Calcula k

range(VARIABLE) # Obtiene el rango

amplitud = K/rango

limites <- seq(liminferior, limitesuperior, by = amplitud)

Creación de la Tabla de Intervalos

tabla_intervalos <- table(cut(variable, breaks = limites, include.lowest = TRUE, dig.lab = 4))

NUEVAVARIABLE2 <- tabla_intervalos

Medidas de Tendencia Central

mediaBibliotecas <- mean(BIBLIOTECAS) # Calcula la media

medianaBibliotecas <- median(BIBLIOTECAS) # Calcula la mediana

summary(BIBLIOTECAS) # Resumen estadístico

quantile(BIBLIOTECAS) # Calcula los cuartiles

quantile(BIBLIOTECAS, 0.90) # Calcula el percentil 90

quantile(BIBLIOTECAS, probs = c(0.20, 0.40, 0.85, 0.90)) # Calcula varios percentiles

Medidas de Dispersión

recorridoBibliotecas <- diff(range(BIBLIOTECAS)) # Calcula el recorrido

rangoIntercBibliotecas <- IQR(BIBLIOTECAS) # Calcula el rango intercuartílico

varBibliotecas <- var(BIBLIOTECAS) # Calcula la varianza muestral

varBibliotecasCorregida <- varBibliotecas * (length(BIBLIOTECAS) - 1) / length(BIBLIOTECAS) # Calcula la varianza corregida

desvBibliotecas <- sd(BIBLIOTECAS) # Calcula la desviación estándar muestral

desvBibliotecasCorregida <- sqrt(varBibliotecasCorregida) # Calcula la desviación estándar corregida

coefVariacionPearsonBibliotecas <- desvBibliotecas / abs(mediaBibliotecas) # Calcula el coeficiente de variación de Pearson

y3 <- (BIBLIOTECAS - mediaBibliotecas)^3 # Calcula la tercera potencia de la desviación de la media

coefAsimetriaBibliotecas <- 1 / (desvBibliotecas^3) * mean(y3) # Calcula el coeficiente de asimetría

y4 <- (BIBLIOTECAS - mediaBibliotecas)^4 # Calcula la cuarta potencia de la desviación de la media

coefApuntamientoBibliotecas <- 1 / (desvBibliotecas^4) * mean(y4) - 3 # Calcula el coeficiente de apuntamiento

Estadística Descriptiva Bivariante

tablaIO <- table(ideologia, opinion)

addmargins(tablaIO) # Agrega márgenes a la tabla

prop.table(tablaIO) # Calcula las frecuencias relativas

addmargins(prop.table(tablaIO)) # Calcula las frecuencias relativas marginales

prop.table(tablaIO, 1) # Frecuencias relativas condicionadas por filas

prop.table(tablaIO, 2) # Frecuencias relativas condicionadas por columnas

Tabla de Doble Entrada

data = matrix(c(450, 164, 65, 56, 100, 825), ncol = 3, byrow = FALSE)

rownames(data) = c('Usuario', 'No Usuario')

colnames(data) = c('Lector asiduo', 'Lector ocasional', 'Sin hábitos de lectura')

data = as.table(data)

data

chisq.test(ideologia, opinion) # Calcula el coeficiente de contingencia de Pearson

CoefContingIO <- sqrt(7.2142 / (7.2143 + 40))

CoefContingIO

  • Si se acerca a 0, mayor independencia entre las variables.
  • Si se acerca a su valor máximo, mayor grado de asociación.

summary(data)

Relación entre Variables Cualitativas

poblacion <- c(12.7, 8.5, 8.2, 7.5, 6.7, 11.5, 10.1, 5.9, 4.4, 4.5)

prestamos <- c(86, 48.8, 51.3, 47.3, 34.9, 94.7, 77, 39.9, 18.1, 36)

plot(poblacion, prestamos)

Coeficiente de Relación Lineal de Pearson

cor(poblacion, prestamos) # Coeficiente de correlación

Recta de Regresión

lm(prestamos ~ poblacion) # Modelo de regresión lineal

Diagrama de Dispersión

plot(poblacion, prestamos)

abline(lm(prestamos ~ poblacion)) # Agrega la recta de regresión al gráfico

Gráficos

sectores = pie(tabcom, main = "Distribución de los municipios en comarcas")

barplot(cumsum(tablabib), main = "Cantidad de bibliotecas por municipios", sub = "Gráfico de frecuencias absolutas acumuladas", xlab = "Bibliotecas", ylab = "Municipios", col = "red")

boxplot(TITULOS, main = "Total de títulos disponibles por municipio")

Distribución de Probabilidad

dbinom(3, 3, 0.5) # Probabilidad de 3 cruces

dbinom(2, 3, 0.5) # Probabilidad de 2 cruces

1 - pbinom(1, 3, 0.5) # Probabilidad de más de una cruz

pbinom(2, 3, 0.5) - pbinom(0, 3, 0.5) # Probabilidad de 1 o 2 cruces

dbinom(12, 50, 0.45)

pbinom(18, 50, 0.45)

Entradas relacionadas: