Métodos Cuantitativos: Distribuciones, Teorema Central del Límite y Muestreo
Enviado por Programa Chuletas y clasificado en Matemáticas
Escrito el en español con un tamaño de 146,15 KB
Métodos Cuantitativos
Distribución de los individuos en la población: Para los individuos en la población se desea estudiar alguna característica que es la variable que puede ser de tipo cualitativa o cuantitativa (discreta o continua). La distribución de la variable en la población o distribución poblacional puede entenderse como la distribución de frecuencias de la variable para toda la población, en donde esa frecuencia es la relativa que se interpreta como distribución de la probabilidad.
Distribución de una observación muestral: Si se toma una muestra de una población genera una variable aleatoria x cuyo valor depende del experimento aleatorio.
P (x = x j) = N j = f j
N
Distribución Conjunta de n observaciones muestrales: Si las observaciones se efectúan con reemplazo (mediante tabla de números aleatorios) cada observación muestral es independiente de las anteriores; así puede generarse lo que se llama “distribución conjunta de n observaciones muestrales” que es el producto de las distribuciones de probabilidad de cada una de las observaciones.
n
P (x1, x2, x3,……, x n) = P(x1) P(x2) P(x3)…….P (x n) = p P(x i)
i = 1
Teorema Central del Límite
Sean x1, x2, x3.......xn variables aleatorias independientes con cualquier distribución y sea m1, m2, m3,….., mn en donde s²1, s²2, s²3…….s²n sus respectivas esperanzas y varianzas respectivamente en donde existe una variable Y como la suma de las n variables independientes con distribución de probabilidad conocida.
La distribución de las variables puede ser normal o pueden tener cualquier tipo de distribución. Si n es la suficientemente grande, la variable Y tiende a distribuirse como una variable aleatoria normal con media igual a la suma de las medias, al igual con relación a las varianzas. Esto significa que al obtener una variable mediante las sumas de las variables independientes, si n > 30 esa suma tiende a una distribución normal y pueden aplicarse a ella los procedimientos que existen para la normal.
Aplicaciones:
_
a) Aplicación a x
_ n
x = 1/ n å x i. La media de las muestras aleatorias de n observaciones
i =1
Independientes extraídas de una población con distribución cualquiera. Con:
E(x) = m v(x) = s²
Recordando que: _ _
E (x) = m V(x) = s² / n
Puede aplicarse el Teorema central del Límite si n es suficientemente grande, de manera tal que si estandarizamos x:
_
z = x - m~ N (0,1)
_
s (x)
Ù
b) Aplicación a p: Cuando la variable aleatoria proviene de una población dicotomizada, en donde x es el numero de éxitos de la muestra, entonces la proporción muestral es:
Ù
p = x / n
ÙÙ
Recordando que: E (p) = p y que V (p) = p .q /n
Ù
Si n es suficientemente grande, por aplicación del T. C. L z = p – P ~ N (0,1)
Ù
s (p)
Muestreo Estratificado:
En este método, la muestra obtenida puede resultar más eficiente que en el muestreo aleatorio simple. Es decir una muestra menor tamaño puede suministrar estimaciones tan exactas como en el muestreo aleatorio simple con una muestra de mayor tamaño. Este muestreo consiste en dividir la población en grupos o estratos homogéneos (tienen la misma característica). En cada estrato se tomara una muestra aleatoria simple sin reposición, donde dicha muestra deberá ser la mejor representación de la Población.
Procedimiento:
1) Se divide la población en grupos o estratos.
2) Se toma una muestra aleatoria simple.
3) En cada muestra obtenida en cada estrato se calcula los parámetros de interés.
Los estratos son mutuamente excluyentes, es decir que cada elemento de la población debe estar en solo una de los estratos.
Simbología Utilizada:
N: tamaño de la población
N h: Tamaño del estrato h con h = 1,2, 3,…., H
H: numero total de estratos.
X h j: j-ésima observación del estrato h (Cualquier elemento del estrato h)
n: Tamaño de la muestra de la población.
n h: tamaño de la muestra del estrato h
X hi: i-ésima observación de la muestra en el estrato h.
Calculo de las formulas por el muestreo estratificado:
Estratos:
1) Media del estrato h: mh = 1 å x h j con j = 1, 2,…, N h
Nh
2) varianza del estrato h: S² h = 1 å (xhj - mh)² con j = 1, 2,…, N h
Nh -1
3) Tamaño relativo del estrato h: W h = N h
N
Muestras
n h: tamaño de la muestra en el estrato h
f h: Tamaño relativo de la muestra en el estrato h f h = n h
N h
_
1) Media de la muestra del estrato h: x h = 1 å x i h con i = 1, 2,…, n h
n h
_
2) Varianza de la muestra del estrato h: s² h = 1 å (x hi – x h) ; i = 1, 2,…, n h
n h – 1
_
3) varianza de la media del estrato h. v (x h ) = S ² (1 – f h)
n h
4) proporción muestral en el estrato h p h = x h
n h
5) Varianza de la proporción en el estrato h V (p h) = P h Q h (1 - f h)
n h -1
Estimadores:
_ H __ H _
x s t = å x h w h V (x s t) = å w h ² v (x h)
h = 1 h = 1
H H
P st = å P h w h V (P st) = å w h ² v (p h)
h = 1 h = 1
Intervalos de confianza:
_ _
1) Para la media IC = x s t ± z Ö v (x s t)
2) Para la proporción IC = p s t ± z Ö v (p s t)
Tipos de Afinación en la muestra
1) Afinación Uniforme: Todos los n h son iguales n h = n / H
2) Afinación Proporcional: El tamaño de la muestra es proporcional al tamaño que tiene el estrato en la población dada.
n h = n N h = n. w h
N
3) Afinación Óptima: El tamaño n h depende del tamaño del estrato y de la variabilidad del estrato
n h = n w h Sh
H
å w h S h
h = 1
Muestreo por Conglomerado
Divide a la población en grupos lo más heterogéneos posibles para que los grupos tengan la heterogeneidad de la población. Los elementos de cada grupo son lo más diferentes posibles.
Una vez que tenemos la población dividida en grupos se selecciona un número de ellos para conformar la muestra sin reposición y determinar su tamaño. Este tipo de muestreo también se denomina muestreo de áreas y se utiliza para reunir información sobre los elementos que están en diferentes regiones o lugares geográficos.
Ventajas:
1) No es necesario un listado de las unidades de análisis porque se hace una delimitación geográfica y todos entran en la muestra.
2) Es menos costoso que el muestreo aleatorio simple porque reduce los costos de desplazamientos para la recopilación de la información
3) Se deben incluir elementos con distintas características para que el conglomerado sea heterogéneo,
Símbolos:
M: número de unidades de análisis en la población
m j: número de unidades de análisis en el conglomerado j-ésimo.
N: Número de conglomerados en la población.
N
M = å m j
J = 1
x i j : Valor en la característica en el elemento j-ésimo del i –ésimo conglomerado
m: numero de unidades de análisis en la muestra
n: número de conglomerados seleccionados en la muestra.
m i: numero de unidades de análisis en el conglomerado i-ésimo seleccionado.
n
m = å m i
i = 1
m i
x i = å x i j total de la característica del conglomerado i-ésimo
j = 1
Estimadores:
_ n
1) x c = 1 å x i Media de la muestra
m i = 1
_ n _
2) V (x c) = ( 1 – f) å ( x i – x c m i) 2 Varianza de la media muestral
i = 1
__
M 2 n (n -1)
Notas: f = n / N tamaño relativo de los conglomerados seleccionados
__
M = M / N Tamaño medio de los conglomerados
_
Si no se conoce la población se tiene en cuenta m = m / n como estimador, es decir el tamaño medio de los conglomerados seleccionados.
3) n
p c = 1 å a i proporción muestral
m i = 1
a i : representa el numero de éxitos en el i-ésimo conglomerado seleccionado.
n
4) V (p c) = ( 1 – f) å ( a i – p c m i) 2 Varianza de la proporción muestral
i = 1
__
M 2 n (n -1)
Intervalos de confianza:
_ _
1) Para la media IC = x c ± z Ö v (x c)
|
2) Para la proporción IC = p c ± z Ö v (p c)
Dócima para diferencias de medias: Población Normal: Varianzas Conocidas
- Prueba de hipótesis a dos colas: Bilateral ; UN. Der ; Izq.
Función del estimador:
_ _ _
H (x 1-2; m 1-2) = x 1-2 - m 1-2 x 1-2 - m 1-2 ~ N (0,1)
s x 1 – 2 s ² 1 + s ²2
n 1 n 2
Región de Aceptación: Con el nivel de significancia α , se calcula la región de rechazo y de aceptación de la H o.
Bilateral: R a Î (-z*, z*); Derecha R a Î (-¥, z*); Unilateral Izquierda R a Î (z*,¥)
Método I: _
Z o = x - m 1-2 Decisión: si z o Î R a. Aceptamos la Ho
s x 1-2 si z o Î R r. Rechazamos la Ho
Método II
Región de Aceptación de hipótesis Nula: _ _
Bilateral: R a Î (x1, x2*)
Unilateral Derecha R a Î (-¥, x*)
Unilateral Izquierda R a Î (x*,¥)
_
x *1-2 = m o ± z* s x1-2 Bilateral
Método III
V P = 2. P r (Z > zo) Bilateral
VP = P r (Z > zo) Unilateral Derecha
VP = P r (Z zo) Unilateral Izquierda
Decisión: Si VP > a . Aceptamos la Ho
Si VP a. Rechazamos la H o
Dócima para diferencias de medias: Población Normal: Varianzas desconocidas pero iguales
_ _ _
H (x 1-2; m 1-2) = x 1-2 - m 1-2 x 1-2 - m 1-2
s x 1 – 2 1 + 1 (n 1 – 1) S 21 + (n 2 – 1) S2 2
n 1 n 2 n 1 + n 2 – 2
Se distribuye T de Student con n 1 + n 2 – 2 grados de libertad
Dócima para diferencias de medias: Población Normal: Varianzas desconocidas pero distintas
_ _ _
H (x 1-2; m 1-2) = x 1-2 - m 1-2 x 1-2 - m 1-2 ~ T con g grados de libertad
s x 1 – 2 s ² 1 + s ²2
n 1 n 2
donde g = (x + y) 2 - 2 tal que x =s ² 1 / n1; y = s ²2 / n2
x2 + y2
n1 -1 n2 -1
Dócima para diferencias de medias: Población No Normal: Varianzas Conocidas donde n 1 o n 2³ 30
_ _ _
H (x 1-2; m 1-2) = x 1-2 - m 1-2 x 1-2 - m 1-2 ~ N (0,1)
s x 1 – 2 s ² 1 + s ²2
n 1 n 2
Dócima para diferencias de medias: Población No Normal: Varianzas Conocidas donde n 1 o n 2³ 100
_ _ _
H (x 1-2; m 1-2) = x 1-2 - m 1-2 x 1-2 - m 1-2 ~ N (0,1)
s x 1 – 2 s ² 1 + s ²2
n 1 n 2
Dócima para cociente de varianzas:
Si de dos poblaciones con distribución normal se seleccionan dos muestras aleatorias independientes de tamaños n1 y n2 , se puede comparar la homogeneidad o variabilidad de dichas poblaciones a través de una prueba de hipótesis para el cociente de varianzas.
Cuando se planteen las hipótesis debe quedar en el numerador la población cuya muestra tenga mayor varianza. Es decir que la población 1 será la que tenga mayor varianza muestral.
Hipótesis Se puede plantear uno de los siguientes tres tipos de hipótesis:
- Prueba de hipótesis a dos colas - Prueba de hipótesis a una cola superior
H0 :
=
ó H0 :
/
= 1 H0 :
=
ó H0 :
/
1
H1 :
ó H1 :
/
1 H1 :
>
ó H1 :
/
> 1
- Prueba de hipótesis a una cola inferior
La función del estimador es:
ÙÙ
H (s² 1/ 2 ; s² 1/ 2 )= s ² 1 s ² 1 con F con m= n 1 – 1; n= n 2 – 1 grados de Lib.
Ù
s ² 2 s ² 2
La región de aceptación se obtiene de la distribución F:
a/2 a/2
|
F*1 F*2
La región de Aceptación de Ho es 1 -a comprendida entre los valores F* en caso de que la dócima sea Bilateral donde se cumple:
Pr {F m, n2} = a/2 + (1 - a)
Pr {F m, n1} = a/2 (no tabulado), entonces se efectúa las siguientes cambios
Pr {F n, m1} = (1 - a/2) y se obtiene 1/ F*1 donde se despeja F*1
La región aceptación de Ho se encuentra comprendida entonces entre (F*1; F*2)
Si la dócima es unilateral entonces la región es la siguiente:
Ra es [0, F*) si la dócima es unilateral derecha
Ra es (F*, ∞) si la dócima es unilateral izquierda
Estadístico de Prueba
Ù
F o = s ² 1 s ² 1
Ù
s ² 2 s ² 2
Decisión:
Si F o pertenece a Ra entonces Acepto Ho con el a correspondiente
Si F o no pertenece a Ra entonces rechazo Ho con el a correspondiente
Control de Calidad:
Concepto: Es una prueba que sirve para mejorar la calidad de los productos haciendo uso de la estadística.
Ningún proceso de producción es tan perfecto como para que todos los productos sean completamente iguales; existen pequeñas variaciones incontrolables.
El control de calidad permite asegurarse que los productos tienen los controles necesarios (longitud, resistencia, etc.). Los controles se realizan durante la producción en intervalos regulares de tiempo, ya que si se hicieran al final de la misma no se podría corregir errores en la producción. Suponiendo el estudio de una variable como por ejemplo: diámetro de una cierta pieza. Si se mide esta pieza con instrumentos que tengan una mayor precisión habrá diferencias las cuales se producen debidas a:
- Causas no Asignables o aleatorias: No son controlables como por ejemplo: Corte de luz, calidad de las maquinas, temperatura
- Causas Asignables o no Aleatorias: Son controlables, es decir variaciones normales del proceso: Desgaste de la maquina, cambios en la materia prima, abandono de un operario, etc.
Las variaciones producidas `por causas aleatorias es la Variabilidad Natural, mientras que las producidas por causas No aleatorias es la Variabilidad No natural.
El control de calidad se divide en: GRAFICOS DE CONTROL; MUESTREO DE ACEPTACION:
Gráficos de control: Consiste en dos líneas paralelas que determinan un intervalo, tales que si el estimador se encuentra dentro del intervalo, decimos que el proceso marcha normalmente , en caso contrario si el proceso esta fuera de control se buscan las causas y se corrigen para que marche normal. El establecimiento de los limites de control se hace suponiendo que la distribución es normal en donde se aplican conceptos de intervalos de confianza y prueba de hipótesis.
Ù •C
m + 3 s Lsc. A, B, C puntos de muestra
Ù •B
m A y B bajo control
Ù •A
m - 3 s Lic. C fuera de control
Errores que se pueden cometer:
a) Error tipo I: error cuando decimos que el proceso esta fuera de control. Decimos que hay causas asignables cuando no las hay. Este error es el más grave porque se detiene el proceso cuando no debimos hacerlo (rechazar la Hipótesis Nula siendo verdadera)
b) Error tipo II: Decimos que el proceso esta marchando bien- Esto significa no parar el proceso cuando si se debería.
P { ET I }= a P {ET II} = b
Dentro de los gráficos de control se diferencian:
Limites de Control: Aquellos que se estipulan para el control a través de análisis estadísticos y determinan si hay causas asignables o no.
Corresponden a un estimador. Por ejemplo la media, varianza, proporción que son los resúmenes de las muestras.
Z depende del nivel de significación, cuando más grande es el valor crítico z, entonces la región de aceptación es más amplia y aumenta la probabilidad de que el estimador se encuentra dentro del intervalo.
Límites de Tolerancia: Son los límites dentro de los cuales la pieza es buena y si esta fuera de ellos se considerara defectuosa.
Variabilidad Natural y Específica:
Variabilidad Natural: Son las variaciones que se producen debido a causas aleatorias en el proceso de las piezas. Es la desviación estándar de las piezas individuales, no de la muestra.
Variabilidad Específica: Es simplemente la variabilidad que surge de los limites de tolerancia del artículo, es decir la distancia entre el límite inferior y superior de tolerancia.
VE = Limite superior de Tolerancia – Limite inferior de tolerancia
Es decir, la amplitud del intervalo donde la pieza pude oscilar para que considere aceptable.
Dimensión Nominal: Es la medida exacta que debería tener la pieza, es la medida optima de la pieza.
_
1) Gráfico de control para la media x
_
a) A partir de R:
_ = _
LC x = x ± 3 R donde A = 3/ √n
√n d2
_ = _
LC x = x ± A R donde A 2 = A/ d2
d2
_ = _
LC x = x ± A2 R
b) _ = _
LC x = x ± 3 S donde A = 3/ √n
√n c
_ = _
LC x = x ± A S donde A 1 = A/ c2
c2
_ = _
LC x = x ± A1 S
Grafica de comparación de planes: Al comparar dos planes el mejor de ellos será el que permite disminuir los dos errores α y β
Casos en los cuales no se puede afirmar el mejor PLAN
Caso 1
|
1
|
Plan A
Plan B
0 P
Caso 2
|
Caso 3
|
1) En el caso 1, si n y c es constante entonces ¯ P (p) por lo que a¯b. El plan B es mejor desde el punto de vista del consumidor porque disminuye β, pero para el productor es mejor el Plan A porque tiene menor α.
2) En el caso 2, si C y n es constante entonces P (p) entonces ¯ab. En este caso el plan A es mejor para el consumidor y para el productor es el B.
3) En el caso 3 se modifican n y c. En este caso si aumentan n c entonces ¯a y ¯b
Muestreo Doble:
El muestreo simple exige la decisión de aceptar o rechazar un lote con base en la evidencia de una sola muestra de dicho lote.
El muestreo doble de aceptación implica la posibilidad de no tomar una decisión sobre el lote hasta después de haber obtenido una segunda muestra. Un lote puede aceptarse enseguida si la primera muestra es lo suficientemente buena o rechazarse de inmediato caso contrario. Pero si la primera muestra no es lo suficientemente buena o lo suficientemente mala, la decisión se basa en el resultado de la primera y segunda muestra combinada. Este método puede ahorrar costos ya que se puede tomar una decisión de rechazar o aceptar con base en una muestra muy pequeña.
N: Tamaño del lote, n1: tamaño de la primera muestra, c1: defectuosos aceptados en el lote, n 2 tamaño en la segunda muestra, n = n 1 + n 2 muestras combinadas, c 2 defectuosos aceptados en la segunda muestra, x 1 numero de defectuosos que se presentan en la 1º muestra.
Procedimiento:
1) Tomamos una muestra de tamaño n
si x £ c1 Aceptamos el lote
si x 1 > c2 Rechazamos el lote
Si c112 tomamos la segunda muestra
2) Al tomar la segunda muestra (n2) se debe tener en cuenta también el número de defectuosos (x2):
Si x2£ c2 – x1 entonces aceptamos el lote
Si x2 > c2 – x1 rechazamos el lote
3) Curva operatoria característica: La probabilidad de aceptar el lote en la primera muestra se define:
P1 (p) = P { x1£ c1} con m = n1. p
P (p) depende de la calidad de entrada p.
La probabilidad de rechazar en la primera muestra el lote se calcula:
P1r (p) = { x1 > c2} con m = n1. p
La probabilidad de pasar a la segunda muestra se expresa por medio de:
P´ (p) = { c11£ c2} con m = n1. p
La suma de las tres probabilidades anteriores debe ser igual a la unidad.
1
|
p1r (p)
|
P´ (p)
P1 (p)
0
|
Probabilidad de aceptar en la segunda muestra:
C2
P2 (p) = å P (x = x 1; m 1) P (x2£ c 2 – x1; m 2)
x 1 = c 1 + 1
Probabilidad de aceptar en la muestra combinada:
P (p) = P 1(p) + P 2 (p)
__
Inspección Muestral promedio: IM = n 1 + n 2 P ´ (p)
Prueba de independencia:
En esta prueba existen variables categóricas y la prueba consiste en suponer que ambas variables son estadísticamente independientes. La independencia implica saber que la categoría en que se clasifica una observación con respecto a una variable, no tiene ningún efecto sobre la probabilidad de caer también en alguna de las diversas categorías de las otras variables. Dicho de otra manera, el problema es determinar si existe relación entre dos conjuntos de atributos de una población. El procedimiento para llevar a cabo la prueba incluye los siguientes pasos:
1) Se especifica cada criterio con sus distintos niveles. Esto determina las filas y las columnas.
2) Se registra en cada celda el número de individuos o entidades que satisfacen al nivel dado por la fila y la columna simultáneamente.
3) Se calculan las frecuencias esperadas:
E i j = n i. n j
n
Condición E i j ³ 5
4) Se fija las hipótesis:
Ho los atributos son variables independientes
H1 los atributos no son variables independientes.
5) La prueba de independencia tiene una Distribución X ² con g l: (f -1) (c– 1)
f c
6) El estadístico de prueba es x² =åå (O i j – E i j)²
i =1 j =1 E i j
Donde f = numero de filas y c = numero de columnas
Prueba de Homogeneidad:
Este método se utiliza cuando se quiere analizar situaciones en las que de antemano, las poblaciones son conocidas como diferentes y el interés radica en tomar una decisión acerca de si el comportamiento es homogéneo respecto a alguna característica. Esta prueba es una extensión del test de independencia donde también se trabaja con datos clasificados y se utiliza el mismo estadístico de prueba. Las diferencias entre ambas pruebas se presenta en alguna de las siguientes:
1) Las pruebas de independencia tienen como objetivo decidir si dos variables son independientes, mientras que la prueba de homogeneidad se aplican cuando se desea saber si diferentes muestras provienen de una misma población.
2) el test de independencia supone una sola muestra obtenida de una sola población, en cambio la prueba de homogeneidad supone dos o mas muestras independientes, donde cada una procede cada una de las poblaciones distintas bajo estudio.
3) En el test de independencia todas las frecuencias marginales son cantidades al azar, mientras que en la prueba de homogeneidad son tañamos de muestras que son numeras elegidos.
Procedimiento:
1) Escogemos una muestra de cada una de las poblaciones de interés.
2) Cada muestra se clasifica de acuerdo con los criterios que se hayan escogidos para el estudio.
3) Realizamos la prueba de Chi-Cuadrado similar a la prueba de independencia
4) planteo de las hipótesis.
Ho Las poblaciones son homogéneas
H1: Las poblaciones no son homogéneas
Prueba de la mediana
Se utiliza para comparar la posición que tienen dos distribuciones poblacionales, es decir si una distribución esta a la derecha o izquierda de otra. Para ello comparamos si tienen o no la misma mediana.
Si el tamaño de la muestra no es grande o la distribución no es normal comparamos la Mediana.
Hipótesis: H o: Las poblaciones tienen la misma mediana, no están desplazados una respecto de la otra.
H 1: Las poblaciones tiene distinta mediana
Procedimiento
1) Se toma una muestra de cada una de las poblaciones
2) Se juntan ambas muestras y se calcula la mediana de esa muestra combinada (n = n 1 + n 2)
3) En cada una de las muestras vemos las observaciones que superan a la mediana y cuantas son menores a ella. Esto permite dividir a la muestra en 2 categorías:
I | II | |
Observaciones > M e | a | b |
Observaciones £ M e | c | d |
n 1 | n 2 |
4) Calculamos el estadístico de prueba
(x ²) o = n (½a d – b c ½- n / 2) ² ~ x ² con 1 grados de libertad
n1 n 2 (a + b) (c + d)
Decisión: Si x ² * > (x ²) o entonces aceptamos H o
Si x ² *£ (x ²) o entonces rechazo H o
Prueba de Wilcoxon
Esta prueba se utiliza para determinar si dos poblaciones tienen la misma posición o no, es decir si están o no desplazadas. En este caso las muestras son dependientes y se denominan apareadas. Para cada elemento de la muestra se plantean dos respuestas de la forma A (a, b)
Procedimiento:
1) Encontrar las diferencias para cada uno de los elementos de la muestra
d i = a i – b i
Se omiten los pares ordenados (a i, b i) en los cuales d i = 0
2) Ordenamos de manera creciente los ½d i½
3) Asignamos un rango r i a los valores ordenados de ½d i½. En caso de que se presenten iguales ½d i½se efectúa el promedio de los rangos r i.
4) Se calculan T - = å r i - y T + = å r i +
Condición: T - + T + = n (n + 1) / 2
5) Planteamos las Hipótesis
Bilateral Derecha Izquierda
Ho A = B A £ B A ³ B
H1 A ¹ B A > B A B
6) Calculamos el estadístico de prueba T = min (T - ; T +) en la dócima Bilateral
T = T – en la dócima Unilateral Derecha
T = T + en la dócima unilateral izquierda
7) Calculamos T * que está tabulado a un nivel de significación a según se trate de una dócima de una o dos colas.
8) Decisión: Si T £ T * entonces rechazamos H o
Si T > T * entonces aceptamos H o
Si n no se encuentra tabulado (n > 50) la variable T se distribuye Normal estándar por lo que necesitamos la esperanza y varianza de T para estandarizar dicha variable:
E (T) = n (n + 1) V (T) = n (n + 1) (2n + 1)
4 24
Usando la distribución Normal podemos calcular Z * y consideramos como estadístico de prueba Z o = T – E (T) / Ö v (T)
Prueba de Mann – Withney
Se utiliza para determinar si dos poblaciones están o no desplazadas, es decir si tienen o no igual posición. En esta prueba las muestras son independientes.
Procedimiento:
1) Tomamos una muestra de cada una de las poblaciones donde n 1 £ n 2 siempre que denominemos a n 1 a la muestra de menor tamaño. Además obtenemos la muestra combinada n = n 1 + n 2 ordenando los elementos de manera creciente
2) Le asignamos a cada elemento un rango r i que es el que le corresponde a cada ordenamiento. Si existen elementos del mismo valor se le asigna el rango promedio de las posiciones que ocupan.
3) Se calcula w 1= å r i j = w o estadístico de prueba
4) Comparar el estadístico de prueba con los valores de la tabla correspondiente a la prueba para aceptar o rechazar la H o dependiendo si se encuentra en la región de aceptación o rechazo.
Para la tabla de la prueba de Mann – Withney encontramos los valores de c 1 y c 2 tal que:
P (w £ c 1) £a * donde a * limite máximo
P (w ³ c2) £a *
Dócima Bilateral
H o Pob. 1 = Pob. 2 En este caso a®a * = a / 2 en la tabla para calcular c 1; c 2
H 1 Pob. 1 ¹ Pob 2 R a Î (c 1, c 2) R r Î[0, c 1] U [ c 2, ¥)
Dócima unilateral derecha
H o Pob. 1 £ Pob. 2 En este caso a = a * y calculo c 2
H 1 Pob. 1 > Pob 2
R a Î[0, c 2) R r Î[ c 2, ¥)
Dócima Unilateral Izquierda
H o Pob. 1 ³ Pob. 2 En este caso a = a * y calculo c 1
H 1 Pob. 1 Pob 2
R rÎ[0, c 1) R a Î[ c 1, L) donde L es el máximo valor que asume w.
Si n 1 y n 2 es mayor que 10, los valores no están tabulados entonces la variable w se distribuye Normal con el cual calculamos la esperanza y varianza.
E (w) = n 1 (n + 1) / 2 w o = w – E (w)
Ö V (w)
V (w) = n 1 n 2 (n + 1) / 12
Prueba de Kolmogorov- Smirnov
Es una prueba en la que se quiere probar que una población tiene una distribución determinada.
Procedimiento:
1) Fijar las hipótesis
H o la población tiene como distribución……
H1 la población no tiene distribución……
2) Tomamos una muestra de tamaño n que nos genera una distribución muestral. Con la muestra construimos una tabla de frecuencias observadas y donde calculamos las frecuencias relativas acumuladas que simbolizamos como F o (x)
3) Se calcula las frecuencias acumuladas esperadas o teóricas que se obtienen de la distribución que se quiere probar y que simbolizamos como F *(x)
4) Calculamos el estadístico de prueba D n = a = máx. │F o (x) – F * (x) │
5) Comparamos D n con el valor tabulado a* en función de n y a:
D n > a* Rechazamos H o
D n £ a * Acepto H o
Capítulo 7: Problemas de inventario y Modelos de Gestión de Stock
Concepto: Los modelos de gestión de stock son políticas de almacenamiento que minimizan el costo de almacenar el producto, ya que se tienen costos del material que se moviliza, costos de realizar el pedido, etc. El objetivo es buscar modelos que determinan los valores de las variables de decisión de modo tal que el costo de stock sea mínimo. En general en un problema de stock tenemos una entrada de producción al almacén (continua, discontinua, constante, desconocida y puede comportarse como una variable aleatoria); de este almacén hay salidas que pueden ser continuas o no, aleatorias o no, en función de la característica del problema se busca encontrar las variables de decisión de modo tal de minimizar el costo total.
Conceptos importantes
Inventario: Es un recurso almacenado para satisfacer una necesidad actual o futura tal como por ejemplo la venta, utilización en el proceso de producción, etc.
Reaprovisionamiento: Es la reposición del inventario como consecuencia de la reducción en el stock.
Costo de pedido: constituye el costo de reaprovisionamiento.
Costo de almacenamiento: es el costo de mantener el stock en almacén durante un cierto periodo de tiempo. Ejemplo: Seguros de almacén, impuestos que afectan a los inventarios, costos causados por depreciación.
Costo de ruptura: Costo que deriva de no tener stock para satisfacer la demanda en los términos establecidos, es decir el costo por el hecho de no tener stock al momento en que se solicitó el producto: Por ejemplo: pagar una multa por atraso en la entrega, por no tener el producto disponible
Símbolos:
- T: representa el periodo de análisis
- t: representa el tiempo en cierta unidad (días, meses, etc.) y el periodo de variación
0 £ t £ T
- N (t): representa la demanda hasta el momento t (Acumulada)
- N (t) – N (t – 1) = n (t): representa la demanda en el periodo t
_ Q (t) = representa la cantidad ingresada al almacén hasta el momento t
_ q (t) = Q (t) – Q (t – 1)
_ S(t) = Q (t) – N(t) : representa el stock en el momento t
_ C p: representa el costo del pedido
_ C s = representa el costo de almacenamiento por unidad de producto y por unidad de tiempo
_ C r: representa el costo de ruptura
_ CT p, CT s, C r: son los costos totales para todo el producto.
Casos de modelos de Stock:
Primer Caso: Lote económico con demanda constante y sin ruptura
Datos: T: periodo N: demanda C s: costo de almacenamiento
C p: costo de pedido
Supuestos:
1) El tiempo que va desde que el pedido ingresa hasta que entra es igual a cero.
2) n (t) = h demanda constante durante todo el periodo de análisis
3) C s y C p los costos de almacenamiento y de pedido son constante
Variables de decisión:
_ q: cantidad a pedir
_ t 1: tiempo de reposición
_ v: numero de pedidos
Representación Grafica:
S (t)
q
|
0 t 1 2 t 1 t
En el momento cero tenemos una cantidad que es cuando ingresa el primer pedido. Luego el stock se va reduciendo hasta llegar al valor cero, eso ocurre en el momento t1, en el cual se repone y lleva al stock al valor q nuevamente después de un nuevo pedido y así sucesivamente.
En este modelo sabemos que: S (0) = S (t 1) = S (t 2) = q donde q es el valor máximo
También tenemos que h = N, se obtiene así la demanda constante
T
Es decir es la demanda por unidad de tiempo y representa el cociente de la demanda total y la unidad de tiempo de todo el análisis.
_ v es el número de pedidos: N = T entonces t1 = T q (periodicidad en los pedidos)
q t1 N
También podemos despejar q = N t 1 = h t 1
T
En definitiva:
h = N / T v = N / q = T / t 1 t 1 = (T/ N) q q = h t
Análisis de los costos
1) Costo total de pedido: costo por pedido * numero de pedidos
CT p = Cp. (N / q) = Cp. v
2) Costo total de almacenamiento: Costo de almacenamiento por unidad * numero de envíos * número de unidades enviadas
CTs = Cs. (N/q). Nº de unidades.
Donde el número de unidades corresponde al área del triangulo, tal que área = b. h
2
Donde se reemplaza entonces se obtiene área = t1. q. tal que t1 = (T/N) q
2
Entonces: C T s= c s. (N/q) t1. q
2
C T s= c s. (N/q) (T/N) q. q
2
Por lo tanto C T s = c s. T. (q/2)
3) Costo total: CT (q) = CT p + CT s = Cp. (N / q) + Cs. T. (q/2)
El objetivo ahora es determinar el valor de q de tal manera de que el costo sea mínimo. El valor de q cuando el costo es mínimo se dice que es optimo, denotado por q 0. Para ello suponemos que q es una variable de tipo continua y derivable, entonces debemos encontrar para los que la función de CT (q) es mínimo y para ello se calcula su derivada primera en la que la misma es igual a cero.
d C T (q) = - Cp. N + Cs. T = 0
d (q) q² 2
Realizamos el despeje de q obteniendo el mínimo y punto optimo
|
q o = 2 Cp. N (Valor óptimo)
Cs. T
Sabemos que t 1 = q. (T / N) de tal manera que si reemplazamos por q obtenemos el t 1 optimo.
|
(t 1) o = 2 Cp. T
C s . N
|
También podemos calcular v o = N / q = N. Cs. T = Cs. T. N
2 Cp. N 2 C p
Reemplazando en el costo total obtenemos:
|
| ||
C T(q o) = C p . Cs. T. N + Cs T 2 Cp. N
2 Cp 2 Cs. T
| |||
|
C T ( q o) = Cp. Cs. T. N + Cp . Cs. T. N
2 2
|
C T ( q o) = 2 Cp. Cs. T. N
Grafica de los costos totales: El costo total de almacenamiento pasa por el origen de coordenadas, el costo total de pedido es una hipérbola, y el costo total responde a una función decreciente respecto de q
C T
C T s
|
C T p
|
0 q o q
Casos de modelos de Stock:
Segundo caso: Lote económico con demanda constante y con ruptura
Datos: T: periodo N: demanda C s: costo de almacenamiento
C p: costo de pedido
C r: costo de ruptura
Supuestos:
1) El pedido se recibe en el momento que se ordena
2) h demanda constante durante todo el periodo de análisis
3) c s, c p y c r los costos de almacenamiento y de pedido son constante
Variables de decisión:
_ q: cantidad a pedir S: stock máximo R: ruptura máxima
_ t 1: tiempo de reposición t2: tiempo en el que hay stock en el periodo
t 3: tiempo en el que hay ruptura en el periodo.
_ v: numero de pedidos
Representación Grafica:
S (t)
S
t 2 t 3
q
0 t 1
R
|
Relaciones:
1) q = S + R 3) h = N / T 5) t1 = (T/N) q
S = h t2 Þ t 2 = S/ h
2) t 1 = t 2 + t 3 4) v = N/q = T/ t1 6) q = h t1
R = h t3Þ t 3 = R / h
Análisis de los costos
1) Costo total de pedido: costo por pedido * numero de pedidos
CT p = Cp. (N / q)
2) Costo total de almacenamiento: Costo de almacenamiento por unidad * numero de envíos * número de unidades enviadas
CT s = Cs. (N/q). Nº de unidades.
Donde el número de unidades corresponde al área del triangulo, tal que área = b. h
2
Donde se reemplaza entonces se obtiene área = t2. S. tal que t 2 = S/ h = S (T/N)
2
Entonces: C T s= c s. (N/q) t 2. S = cs. N S T S = c s. T. S2
2 q N 2 2 q
Por lo tanto CT s (q, S) = c s. T. S2
2 q
3) Costo total de Ruptura:
CT r = c r. v. Nº de unidades donde área de ruptura = t 3. R
2
= R R = R 2 = R2 T
h 2 2h 2 N
|
CT r = c r. N R2 T = c r R2 T
q 2 N 2 q
Reemplazamos R = q – S para expresar el costo total en función de esas variables.
C T r (q, S) = c r (q – S) 2 T
2q
Efectuando la suma de los costos obtenidos, obtenemos el costo total de stock como función de las variables de decisión q y S.
C T (q, S) = c p N + c s T S2 + c r (q- S) 2 T
q 2 q 2q
Para determinar los valores de q y de S para minimizar el costo total procedemos a derivar la función de costo en términos de q y de S.
a) d (CT) = 0 + 2 c s T S + 2 c r (q – S) (-1) T = 0
d (s) 2q 2 q
Donde se despeja q de la igualdad anterior:
q = S (c r + c s) (1)
c r
q2 – S2
|
b) d (CT) = - c p N - c s T S 2 + c r T 2 (q – S) q – (q – S) 2 = 0
d (q) q2 2 q2 2 q 2
- c p N - c s T S 2 + c r T (q2-S2) = 0
q2 2 q2 2 q2
Multiplicamos miembro a miembro, la igualdad anterior, por 2 q2; luego se despejan los términos con las variables de decisión q y S obteniendo:
- c s S2 + c r (q2 – S2) = 2 c p N
T
Si reemplazamos en la igualdad anterior por la relación (1) se despeja S, obteniendo la cantidad máxima a pedir optima.
|
|
S* = 2c p N c r
c s T c r + c s
rÞ Tasa de ruptura
Reemplazando las relación de S* en (1) obtenemos q*
q* = 2c p N c r + c s
c s T c r
Se obtienen, también las siguientes relaciones:
t 1* = q* T
N
| |||
| |||
(t 1) o = 2 Cp. T c r + c s
C s . N c r
|
| ||
Min CT (q*, S*) = 2 c p. c s. T. N c r
c r + c s