Resumen de Fórmulas y Ejercicios de Estadística Descriptiva e Inferencial
Enviado por Programa Chuletas y clasificado en Matemáticas
Escrito el en español con un tamaño de 11,15 KB
Examen Ordinaria 2018
1- Salario medio región A sigue distribución Normal con una media de 1460 y desv. Típica 300.
A) Por lo tanto región A el 60 % trabajadores tiene un salario medio x debajo de??
S = salario medio en A ; S ∈ N (1460,300) ; 0,6 = P{ S (a – 1460) / 300 } -> a – 1460 / 300 = buscar tabla Normal (dentro el 0,4) y es 0,25 ; a – 1460 = 0,25 * 300 = 1535
b) ¿Cuál es la probabilidad de q el salario medio sea + de ?
P { S > 1500 } ; P { S > 1500 } = P { S > (1500 – 1460) / 300 } = P { S > 0,13 } -> buscar tabla normal (fuera 0,13) = 0,4483
C) ¿Cuál es el salario a, q la prob. De que el salario medio se encuentre entre 1750 es 0,45?
¿a? P { a 0,97 } “buscar tabla norma fuera 0,97” = 0,45 + 0,166 = 0,6160 ; = P { z 1460 – a = 0,295 “buscar tabla Normal dentro 0,384= 0,295” -> a = 1460 – 300 * 0,295 = 1371,5
D) Se han planteado 2 tipos de subidas de salario prox año. 1- subida 2,5 % y 1- 20€. ¿Con cuál de las dos se mejora homogeneidad salarios?
S1 = 1025 S -> CV (S1) = 1025 * 300 / 1025 * 1460 = 0,2054 ; S2 = S + 20 -> CV (S2) = 300 / (1460 + 20) = 0,2027 Es más homogénea con 52 porque Cv S2
3) A los trabajadores anteriores tb se les pregunto x el numero de asalariados de su empresa … (datos agrupados)
A) Podemos considerar q existe algún tipo de relación lineal entre el nº trabajadores en la empresa y el salario de los mismos?
Meter la variable s, anterior ejercicio Σ si = 25117 Σ Si^2 = 41713407 Meter la variable E Σ Ei = 89 Σ Si^2 = 659 Meter la variale Si * Ei (2207*10…. M+ ) R xy = S` es / raíz S`e * S`s S` es = Σ se/16 - Σ si/16 * Σ ei/16 S`e = Σ ei^2 /16 - (Σ ei)^2 S`s = Σ Si^2/16 - (Σ si)^2 rxy= 0,159 si hay relación lineal , directa y pequeña
B) Suponiendo q exista relación lineal construye el modelo lineal q nos da el salario de un trabajador en función del numero de empleados en la q trabaja
S * = a + b E b = S `se / S`e ^2 = 49355 /16^2 / 2623 / 16^2 = 18,81 a= Σ Si – b * Σ Ei = 25117/16 - 18,81 * 89/16 = 1464,14
C) Utiliza el modelo anterior para determinar el salario de un trabajador si sabemos q en la empresa hay 7 asalariados:
E = 7 S *= a + b * E = 1464,14 + 18,81 * 7 = 1596,86 -> Proximo si Modelo adecuado, Si Bondad del ajuste = R^2 (coef bondad y ajuste) = S’xy^2 / S’x^2* S’y^2 = 0,02541 No no es fiable
2) Si queremos construir intervalo confianza, IC 0,85 (μ) para el salario medio , EM desv tip
A ¿Cuál será tamaño muestra?
Inferencia sobre μ con R^2 conocido ; Si m.a.s. y X ∈ Normal -> ( - μ) / (r / raíz n) ∈ N (0,1) EM = Z α /2 * (r / raíz n) -> n = ((Z α /2 * r) / EM)^2 ; 1- α = 0,95 -> α = 0,05 -> Z α/2 = Z 0,025 = 1,96 “buscar tabla normal, fuera 1,96” ; n = (1,96 * 300 / 50) ^2 = 138,19 -> n ≥ 139
B) Al final hemos decidido tomar muestra tamaño 16:
Ordenar valor y meterlos en la calculadora (Mode 2 Sd) ir metiéndolos para guardar M+ , Shift 2 (media, desv, típica -> si le das al ^2 te sale varianza y cuasi desviación -> si le das al ^2 te sale Cuasivariana )
C) Construye e intérprete. El intervalo confianza al 95% para salarios medio trab. Región b.
IC 0,95 (μ) Inferencia sobre μ ; x= salario región b ; Si m.a.s. y X ∈ Normal -> ( - μ) / (r / raíz n) ∈ tn-1 ; IC 1 – α (μ) = +- [tn-1 , α/2]* s/raíz n ) ; tn -1 = 15 , α/2=0,05 t15, 0,05= 2,1314 (tabla t-student) IC 0,95 (μ) = 1569,8 + - 2,1314 * 390,25 / raiz 16 = (1361,86 , 1777,75) * Cond. Validez = variable q mide puntuaciones medias de los estudiantes siguen una distr. Normal - Los 16 trab. sea una muestra representativa en el rendimiento académico El intervalo es válido si se cumplen condiciones validez
D) ¿Podemos aceptar, con un nivel confianza 90 % , la afirmación de las autoridades de q la región b el 70 % de los salarios esta x encima de los 1500?
P= proporción salarios x encima 1500 , Ho : p = 0,7 H1 : p =/ 0,7 s = n ≥ 30 ( o n p y n (1-p) ≥ S) gorrito ∈ N (p , raíz ((p* 1-p)/n) -> gorrito – p / raíz ((p* 1-p)/n) ∈ N (0,1) ; gorrito = 10 / 16 = 0,625 ; V. obs = 0,625 – 0,7 / raíz (0,7 * (1-0,7) / 16) = - 0,65464 E (-1645, 1645) -> buscando tabla t student 0,05 y infinito , del 1- α= 0,01 / 2 0,0,5
4- Coeficiente correlación x rangos Spearman Hacer
tabla 1- Columna (ST) ordenado de A – D 2- Columna (SS) ordenar como te lo da 3- tabla (Rst Prov) poner numero 1 al 16 ordenados de arriba abajo 4- tabla (Rss Prov) poner numero ordenador por la letras de la colmna 2 5- Columna (RST) sumar la columna 3 de A ejemplo= 10 / 4= 20,5 6- Columna igual q la anterio pero de la columna 4 7- Columna (di) restar columna 5 (Rst) – columna 6 (Rss) = 2,5-1,5 = 1 8- Columna elevar la 7 columna a la 2. Por ultimo en la ultima fila se hace el sumatorio = 150
A) ¿Cómo es la asociación entre ambos?
P = 1 – [( 6 Σ di ^2 ) / N^3 –N] = 1 – [(6 * 150) / (16^3 – 16)] = 0,779 existe una relación de asociación grande y directa entre trabajo y salario.
B) ¿Cuál es la probabilidad de que no este en el grupo trabaj muy satisfechos?
P ( SS = A) = 2/16 = 0,125 , P (SS =/A ) = ST = A = 2/4= 0,5
Ejercicio intervalos ( distribución de frecuencias)
- Hacer tabla con: (intervalo caudal) , (meses=ni), (xi = mitad intervalo),(Ni sumatorio ni), (hi = ni/ai ai=amplitud intervalo 15 35=20), (xi * ni), (xi^2 * ni)
A) Caudal medio
= Σxi*ni / Ni
B) Caudal más frecuente?
(Valor más alto de hi, Intervalo modal 0-3 Mo= 1,5 se mira hi pero se pone xi
C) Completa afirmación: el 75% de los mese el caudal del rio se sitúa por debajo de …
= [(1+Ni total ) * r] / 100 = 1+72 * 75 /100 = se mira en NI pero se contesta xi
D) Otro rio cv= 0,25 ¿En cuál de los dos ríos más representativo?
1º S’2 (varianza) = Σ [(xi^2 * ni ) / N ] - ^2 s’ (desv. Típica) =
CV coef. Variación de Pearson =( s’ / ) Cuanto mas cerca de 0 mas homogéneo y – disperso ( más representativa cerca)
D) Si pide Asimetría
, As= - Mo / s’ A>0 asimetría derecha A
Teda tabla x e y, hacer correlación lineal y recta regresión
- Te da tabla y Σxi, Σyi, Σxi^2 , ΣYi^2, , Σxi,yi Calcular media , varianza, desv típica y s’xy ,Media de e y = Σxi*ni / Ni S’2x e y (varianza) = [(∑ xi^2 * ni ) / N ] * ^2 s’x e y (desv. Típica) =
Covarianza S’xy= (∑xi*ni / Ni ) – ( media x * media y)
A) ¿Existe correlación lineal? ¿fuerte o débil?¿directa o inversa?
r xy (coef, correlación linal) = s’xy / (s’x *s’y)= Resultad fuerte cuando cerca de -1 y 1, cuando es positivo es directa y negativo inversa
B) ¿Calcula recta regresión tº función latitud? Latitud x y tº y
- Se hace y/x y= a+bx ; b= (s’xy / s’x^2) a= media y – b * media x = y = a + bx
C) con la recta anterior predecir la tº q tiene latitud 45 ¿consideras fiable predicción, por que?
Y= a + b x ; x= 45 Si el resultado de y no esta dentro de la tabla no es fiable sino SI r’2 (coef bondad y ajuste) = S’xy^2 / S’x^2* S’y^2 Resultado es mayor q 0,7 modelo bueno 0,3 regular 0 malo
D) Si incrementamos la latitud 45 1% ¿q porcentaje disminuirá?
E x/y * b = - 1,54 Si aumenta 1% la latitud la tº disminuirá en – 1,54
En un estudio muestra (n)=25 puntuación media ()= 148, cuasi desviación(s) = 36:
A) calcula e interpreta intervalo confianza 99% t24, 0,005= 2,7969 (tabla t-studet)
IC = (-[tn-1 , α/2]* s/raíz n , +[tn-1 , α/2]* s/raíz n ) * Cond. Validez = variable q mide puntuaciones medias de los estudiantes siguen una distr. Normal - Los 25estudiantes sea una muestra representativa en el rendimiento académico
B) basándonos en el intervalo anterior ¿se puede aceptar q a puntuación media valga 160?
Si, xk se encuentra dentro de los dos intervalo
C) Comprueba la respuesta dad anterior realizando el contraste apropiado
Ho: μ =160 H1: μ =/160 dibujar – 2,7969 + 2,7969 t= ( - μ) / (s / raíz n ) = - 1,667 Se acepta la hipótesis nula xk se encuentra dentro de la región de la aceptación.
D) confianza 95% y EM= 0,06 ¿Cuál debe ser el tamaño de la muestra mínimo? Buscar tabla normal t (z) α= 0,05
α/2=0,025 Z α/2= 1,96 EM= tn-1 , α/2 * (s/n) n= (Z^2 α;/2 * s^2) / EM^2= tamaña muestral mínimo
Tabla cifras población de un país IPC:
A) Serie índices cada año respecto anterior año 0=
0 año1 = año 0 /año 1 * 10
B) interpreta índices del año 2014 respeto 2013=
año 2013 / año 2014 Lo q de es lo que a aumentado la población
C) determina índice cada año respecto 2016=
año 12 / año 16 *100 , año 13/ año 16 *100…. Año 2016 = 100
D) índice 2016 respecto a 2009 fue 1,035 ¿calcula tamaño de la población en el año 2009?
I 09 16= T 09 / T 16*100 ; 103,5 = X / 15,07 *100 ; 1035*15,07 / 100= X
% para calcular probabilidad: hombres 35y mujeres 135 , tratamiento 70 ,no tratamiento 100 total clientes 170
A) taba contingencia bidimensional
15, 55 ; 20 ,80
B) Calcula probabilidad que eligiera al azar sea hombre y recib tratamiento corp?
P (H ∩ TC) = 15/170
C) Dentro de hombres ¿porcentaje q representa los clientes q recibir trat. Copr?
P ( TC / H) 15/35*100
D) porcentaje q representan los hombres dentro de las personas q hacen tra. Cor?
15/70*100
E) Establece si hay asoc. Entre hombres y recibir trat corp ¿fuerte o débil? ¿ + o - ?
Q yule = n11 * n22 – n21* n12 / n11 * n22 + n21* n12 = Si sale 0 = independencia no asociación , > 0 asociación positiva, Coeficiente asociación -> H = nij – [( ni * nj ) / N ] 1 concordancia -1 Discordancia 0 No hay relación IG: 2 Σ qi * Pi – 1 = entre 0 y 1