Estadística Aplicada: Població, Mostra i Paràmetres Estadístics
Enviado por Programa Chuletas y clasificado en Matemáticas
Escrito el en catalán con un tamaño de 6,16 KB
Estadística aplicada
Població i mostra
Població és la totalitat del sistema objecte d'estudi. La mostra és una porció representativa de la població. Si tenim tècniques de mostreig, hauríem de tenir coneixement per triar 12 o 14 unitats que serien les que analitzaríem. L'objectiu analític és estimar paràmetres de la població analitzant mostres reduïdes.
Paràmetres estadístics que estimen el valor central (mitjana aritmètica, mediana, moda)
Mitjana aritmètica: Com a estimació del valor d'una població, és el paràmetre que s'utilitza amb més freqüència, tot i que és un paràmetre poc robust, ja que si algun dels resultats individuals conté un error apreciable, aquest es transmet a la mitjana aritmètica. Quan els resultats estan distribuïts normalment i són independents, aquest és el paràmetre més útil com a estimació del valor central. *veure distribució normal*
La mediana: És una estimació del valor central més robusta. Es defineix, una vegada els resultats han estat ordenats de menor a major, com el resultat situat al centre. Si tenim un número parell de resultats, es defineix com la semisuma dels dos resultats situats al centre. S'usa preferiblement quan no ens interessa tota la informació d'un conjunt de dades en les que els valors extrems perden significat.
La moda: És el valor més freqüent d'una sèrie de dades. En una mateixa sèrie de dades es poden donar dues o tres modes, en aquest cas diríem que es tracta d'una sèrie polimodal.
Donada la sèrie de valors: 15, 17, 17, 19, 20, 20, 23, 24
Calcular la mitjana aritmètica: 19
La mediana: (19+20)/2 = 19.5
La moda: 17 i 20
Paràmetres estadístics
Desviació estàndard (ds o s): Estima la dispersió dels resultats al voltant del seu valor mitjà, i té en compte els graus de llibertat n-1 del conjunt de resultats considerats. (fórmula). Té les mateixes unitats que la mitjana aritmètica. La informació proporcionada per la desviació estàndard pot ser poc clara si no es té en compte la magnitud que s'està mesurant.
Quan els resultats estan distribuïts normalment i són independents, els paràmetres estadístics més útils són: la mitjana aritmètica com a estimació del valor central i la desviació estàndard com a mesura de la dispersió.
Desviació estàndard relativa (RSD) o coeficient de variació: Donat que un mateix valor de la desviació estàndard per dos conjunts de resultats diferents pot tenir un significat analític totalment diferent, s'utilitza la desviació estàndard relativa que és independent de les unitats de mesura. RSD = CV(%) (fórmula).
La variància, representada per S2, és el quadrat de la desviació estàndard. Aquest paràmetre és molt utilitzat en estudis de propagació d'errors.
Anàlisi de la distribució de dades
Encara que la desviació estàndard ens proporciona una mesura de la dispersió d'un conjunt de resultats al voltant d'un valor mitjà, no indica la forma en què es distribueixen els resultats. Per poder-ho saber, es necessita un gran nombre de mesures.
Una distribució és una representació de la freqüència absoluta o relativa de les dades obtingudes. És la freqüència absoluta dividida per la freqüència total. Si considerem l'exemple del dossier (taula 2.1), la distribució s'aprecia dibuixant l'histograma.
El conjunt de les 50 mesures de la concentració de nitrat constitueixen una mostra d'un gran nombre d'elles, en teoria infinites. La informació gràfica és molt important perquè ens mostra la possible polarització o agrupació de les dades. Les distribucions es poden classificar segons tres criteris independents: la seva forma, la seva simetria i la seva amplitud.
Distribucions segons la seva forma
La distribució més habitual és la que té forma de campana, en què un dels valors és més probable. S'anomena distribució gaussiana o distribució normal. De forma gràfica, és fàcil determinar si la distribució és modal, bimodal o polimodal. Una distribució bimodal és quan la font de les dades és diferent, per exemple, si procedeixen de balances no calibrades (mirar figura 3.5 dossier).
Distribucions segons la seva simetria
Per a una distribució gaussiana, la simetria està relacionada amb les cues de cada costat de la corba. S'estableixen 3 tipus de forma: (veure figura 3.7 dossier)
- Distribució simètrica: En aquest cas, la moda és igual a la mitjana i a la mediana.
- Distribució asimètrica positiva: En aquest cas, la moda és més gran que la mitjana i al mateix temps més gran que la mediana.
- Distribució asimètrica negativa: Mitjana més petita que la mediana.
Distribució segons la seva amplitud
En augmentar el nombre de dades experimentals, habitualment s'observa que les distribucions tendeixen a la normalitat. A efectes pràctics, es consideren els següents casos:
- nt de Student.
- n>=30: En aquest cas, es considera que la sèrie de dades constitueix una distribució suficientment normal com per poder aplicar les propietats de les funcions gaussianes, és quan la corba obtinguda és normal. Això s'aconsegueix amb centenars o milers de dades.
Propietats de les funcions normals: Matemàticament, les variables normals segueixen una distribució normal o equació de Laplace-Gauss.