Resumen de Fórmulas y Ejercicios de Estadística Descriptiva e Inferencial

Enviado por Programa Chuletas y clasificado en Matemáticas

Escrito el en español con un tamaño de 11,15 KB

Examen Ordinaria 2018

1- Salario medio región A sigue distribución Normal con una media de 1460 y desv. Típica 300.

A) Por lo tanto región A el 60 % trabajadores tiene un salario medio x debajo de??

S = salario medio en A ; S ∈ N (1460,300) ; 0,6 = P{ S (a – 1460) / 300 } -> a – 1460 / 300 = buscar tabla Normal (dentro el 0,4) y es 0,25 ; a – 1460 = 0,25 * 300 = 1535

b) ¿Cuál es la probabilidad de q el salario medio sea + de ?

P { S > 1500 } ; P { S > 1500 } = P { S > (1500 – 1460) / 300 } = P { S > 0,13 } -> buscar tabla normal (fuera 0,13) = 0,4483

C) ¿Cuál es el salario a, q la prob. De que el salario medio se encuentre entre 1750 es 0,45?

¿a? P { a 0,97 } “buscar tabla norma fuera 0,97” = 0,45 + 0,166 = 0,6160 ; = P { z 1460 – a = 0,295 “buscar tabla Normal dentro 0,384= 0,295” -> a = 1460 – 300 * 0,295 = 1371,5

D) Se han planteado 2 tipos de subidas de salario prox año. 1- subida 2,5 % y 1- 20€. ¿Con cuál de las dos se mejora homogeneidad salarios?

S1 = 1025 S -> CV (S1) = 1025 * 300 / 1025 * 1460 = 0,2054 ; S2 = S + 20 -> CV (S2) = 300 / (1460 + 20) = 0,2027 Es más homogénea con 52 porque Cv S2

3) A los trabajadores anteriores tb se les pregunto x el numero de asalariados de su empresa … (datos agrupados)

A) Podemos considerar q existe algún tipo de relación lineal entre el nº trabajadores en la empresa y el salario de los mismos?

Meter la variable s, anterior ejercicio Σ si = 25117 Σ Si^2 = 41713407 Meter la variable E Σ Ei = 89 Σ Si^2 = 659 Meter la variale Si * Ei (2207*10…. M+ ) R xy = S` es / raíz S`e * S`s S` es = Σ se/16 - Σ si/16 * Σ ei/16 S`e = Σ ei^2 /16 - (Σ ei)^2 S`s = Σ Si^2/16 - (Σ si)^2 rxy= 0,159 si hay relación lineal , directa y pequeña

B) Suponiendo q exista relación lineal construye el modelo lineal q nos da el salario de un trabajador en función del numero de empleados en la q trabaja

S * = a + b E b = S `se / S`e ^2 = 49355 /16^2 / 2623 / 16^2 = 18,81 a= Σ Si – b * Σ Ei = 25117/16 - 18,81 * 89/16 = 1464,14

C) Utiliza el modelo anterior para determinar el salario de un trabajador si sabemos q en la empresa hay 7 asalariados:

E = 7 S *= a + b * E = 1464,14 + 18,81 * 7 = 1596,86 -> Proximo si Modelo adecuado, Si Bondad del ajuste = R^2 (coef bondad y ajuste) = S’xy^2 / S’x^2* S’y^2 = 0,02541 No no es fiable

2) Si queremos construir intervalo confianza, IC 0,85 (μ) para el salario medio , EM desv tip

A ¿Cuál será tamaño muestra?

Inferencia sobre μ con R^2 conocido ; Si m.a.s. y X ∈ Normal -> ( - μ) / (r / raíz n) ∈ N (0,1) EM = Z α /2 * (r / raíz n) -> n = ((Z α /2 * r) / EM)^2 ; 1- α = 0,95 -> α = 0,05 -> Z α/2 = Z 0,025 = 1,96 “buscar tabla normal, fuera 1,96” ; n = (1,96 * 300 / 50) ^2 = 138,19 -> n ≥ 139

B) Al final hemos decidido tomar muestra tamaño 16:

Ordenar valor y meterlos en la calculadora (Mode 2 Sd) ir metiéndolos para guardar M+ , Shift 2 (media, desv, típica -> si le das al ^2 te sale varianza y cuasi desviación -> si le das al ^2 te sale Cuasivariana )

C) Construye e intérprete. El intervalo confianza al 95% para salarios medio trab. Región b.

IC 0,95 (μ) Inferencia sobre μ ; x= salario región b ; Si m.a.s. y X ∈ Normal -> ( - μ) / (r / raíz n) ∈ tn-1 ; IC 1 – α (μ) =  +- [tn-1 , α/2]* s/raíz n ) ; tn -1 = 15 , α/2=0,05 t15, 0,05= 2,1314 (tabla t-student) IC 0,95 (μ) = 1569,8 + - 2,1314 * 390,25 / raiz 16 = (1361,86 , 1777,75) * Cond. Validez = variable q mide puntuaciones medias de los estudiantes siguen una distr. Normal - Los 16 trab. sea una muestra representativa en el rendimiento académico El intervalo es válido si se cumplen condiciones validez

D) ¿Podemos aceptar, con un nivel confianza 90 % , la afirmación de las autoridades de q la región b el 70 % de los salarios esta x encima de los 1500?

P= proporción salarios x encima 1500 , Ho : p = 0,7 H1 : p =/ 0,7 s = n ≥ 30 ( o n p y n (1-p) ≥ S)  gorrito ∈ N (p , raíz ((p* 1-p)/n) ->  gorrito – p / raíz ((p* 1-p)/n) ∈ N (0,1) ;  gorrito = 10 / 16 = 0,625 ; V. obs = 0,625 – 0,7 / raíz (0,7 * (1-0,7) / 16) = - 0,65464 E (-1645, 1645) -> buscando tabla t student 0,05 y infinito , del 1- α= 0,01 / 2 0,0,5

4- Coeficiente correlación x rangos Spearman Hacer

tabla 1- Columna (ST) ordenado de A – D 2- Columna (SS) ordenar como te lo da 3- tabla (Rst Prov) poner numero 1 al 16 ordenados de arriba abajo 4- tabla (Rss Prov) poner numero ordenador por la letras de la colmna 2 5- Columna (RST) sumar la columna 3 de A ejemplo= 10 / 4= 20,5 6- Columna igual q la anterio pero de la columna 4 7- Columna (di) restar columna 5 (Rst) – columna 6 (Rss) = 2,5-1,5 = 1 8- Columna elevar la 7 columna a la 2. Por ultimo en la ultima fila se hace el sumatorio = 150

A) ¿Cómo es la asociación entre ambos?

P = 1 – [( 6 Σ di ^2 ) / N^3 –N] = 1 – [(6 * 150) / (16^3 – 16)] = 0,779 existe una relación de asociación grande y directa entre trabajo y salario.

B) ¿Cuál es la probabilidad de que no este en el grupo trabaj muy satisfechos?

P ( SS = A) = 2/16 = 0,125 , P (SS =/A ) = ST = A = 2/4= 0,5

Ejercicio intervalos ( distribución de frecuencias)

- Hacer tabla con: (intervalo caudal) , (meses=ni), (xi = mitad intervalo),(Ni sumatorio ni), (hi = ni/ai ai=amplitud intervalo 15 35=20), (xi * ni), (xi^2 * ni)

A) Caudal medio

= Σxi*ni / Ni

B) Caudal más frecuente?

(Valor más alto de hi, Intervalo modal 0-3 Mo= 1,5 se mira hi pero se pone xi

C) Completa afirmación: el 75% de los mese el caudal del rio se sitúa por debajo de …

= [(1+Ni total ) * r] / 100 = 1+72 * 75 /100 = se mira en NI pero se contesta xi

D) Otro rio cv= 0,25 ¿En cuál de los dos ríos más representativo?

1º S’2 (varianza) = Σ [(xi^2 * ni ) / N ] - ^2 s’ (desv. Típica) =
QYQjyNFFA0WGn8hRxP4NAojrBQkcG0IhQ8SyoI4e
CV coef. Variación de Pearson =( s’ / ) Cuanto mas cerca de 0 mas homogéneo y – disperso ( más representativa cerca)

D) Si pide Asimetría

, As=  - Mo / s’ A>0 asimetría derecha A

Teda tabla x e y, hacer correlación lineal y recta regresión

- Te da tabla y Σxi, Σyi, Σxi^2 , ΣYi^2, , Σxi,yi Calcular media , varianza, desv típica y s’xy ,Media de  e y = Σxi*ni / Ni S’2x e y (varianza) = [(∑ xi^2 * ni ) / N ] * ^2 s’x e y (desv. Típica) =
QYQjyNFFA0WGn8hRxP4NAojrBQkcG0IhQ8SyoI4e
Covarianza S’xy= (∑xi*ni / Ni ) – ( media x * media y)

A) ¿Existe correlación lineal? ¿fuerte o débil?¿directa o inversa?

r xy (coef, correlación linal) = s’xy / (s’x *s’y)= Resultad fuerte cuando cerca de -1 y 1, cuando es positivo es directa y negativo inversa

B) ¿Calcula recta regresión tº función latitud? Latitud x y tº y

- Se hace y/x y= a+bx ; b= (s’xy / s’x^2) a= media y – b * media x = y = a + bx

C) con la recta anterior predecir la tº q tiene latitud 45 ¿consideras fiable predicción, por que?

Y= a + b x ; x= 45 Si el resultado de y no esta dentro de la tabla no es fiable sino SI r’2 (coef bondad y ajuste) = S’xy^2 / S’x^2* S’y^2 Resultado es mayor q 0,7 modelo bueno 0,3 regular 0 malo

D) Si incrementamos la latitud 45 1% ¿q porcentaje disminuirá?

E x/y * b = - 1,54 Si aumenta 1% la latitud la tº disminuirá en – 1,54

En un estudio muestra (n)=25 puntuación media ()= 148, cuasi desviación(s) = 36:

A) calcula e interpreta intervalo confianza 99% t24, 0,005= 2,7969 (tabla t-studet)

IC = (-[tn-1 , α/2]* s/raíz n , +[tn-1 , α/2]* s/raíz n ) * Cond. Validez = variable q mide puntuaciones medias de los estudiantes siguen una distr. Normal - Los 25estudiantes sea una muestra representativa en el rendimiento académico

B) basándonos en el intervalo anterior ¿se puede aceptar q a puntuación media valga 160?

Si, xk se encuentra dentro de los dos intervalo

C) Comprueba la respuesta dad anterior realizando el contraste apropiado

Ho: μ =160 H1: μ =/160 dibujar – 2,7969 + 2,7969 t= ( - μ) / (s / raíz n ) = - 1,667 Se acepta la hipótesis nula xk se encuentra dentro de la región de la aceptación.

D) confianza 95% y EM= 0,06 ¿Cuál debe ser el tamaño de la muestra mínimo? Buscar tabla normal t (z) α= 0,05

α/2=0,025 Z α/2= 1,96 EM= tn-1 , α/2 * (s/n) n= (Z^2 α;/2 * s^2) / EM^2= tamaña muestral mínimo

Tabla cifras población de un país IPC:

A) Serie índices cada año respecto anterior año 0=

0 año1 = año 0 /año 1 * 10

B) interpreta índices del año 2014 respeto 2013=

año 2013 / año 2014 Lo q de es lo que a aumentado la población

C) determina índice cada año respecto 2016=

año 12 / año 16 *100 , año 13/ año 16 *100…. Año 2016 = 100

D) índice 2016 respecto a 2009 fue 1,035 ¿calcula tamaño de la población en el año 2009?

I 09 16= T 09 / T 16*100 ; 103,5 = X / 15,07 *100 ; 1035*15,07 / 100= X

% para calcular probabilidad: hombres 35y mujeres 135 , tratamiento 70 ,no tratamiento 100 total clientes 170

A) taba contingencia bidimensional

15, 55 ; 20 ,80

B) Calcula probabilidad que eligiera al azar sea hombre y recib tratamiento corp?

P (H ∩ TC) = 15/170

C) Dentro de hombres ¿porcentaje q representa los clientes q recibir trat. Copr?

P ( TC / H) 15/35*100

D) porcentaje q representan los hombres dentro de las personas q hacen tra. Cor?

15/70*100

E) Establece si hay asoc. Entre hombres y recibir trat corp ¿fuerte o débil? ¿ + o - ?

Q yule = n11 * n22 – n21* n12 / n11 * n22 + n21* n12 = Si sale 0 = independencia no asociación , > 0 asociación positiva, Coeficiente asociación -> H = nij – [( ni * nj ) / N ] 1 concordancia -1 Discordancia 0 No hay relación IG: 2 Σ qi * Pi – 1 = entre 0 y 1

Entradas relacionadas: