Ensayo
MEDIDAS DE DISPERSIÓN
Las medidas de tendencia central de un conjunto de mediciones solamente localizan el centro de la distribución de los datos. Por si mismo, no ofrecen una descripción adecuada de los datos. Por ejemplo, dos conjuntos de mediciones podrían tenersus distribuciones de frecuencias muy diferentes pero con la misma media. La diferencias entre dos distribuciones, puede estar en variación o dispersión a ambos lados de la media. Una descripción adecuada de los datos requiere de la definición de una medida de variabilidad de los datos. La medida más común de variabilidad usada en la estadística es la varianza, que es una función de lasdesviaciones (o distancia) de las mediciones con respecto a su media. Podemos defiir dos tipos de varianza una poblacional y otra muestral, que en cada acaso para su respetivo análisis se tomara e el primer caso la población(N) y en el otro la muestra (n). A continuación se trataran los análisis para la conclusión de os procesos muestrales, clasificados en dos casos, uno para datos agrupados y otro paradaos no agrupados. Definición 2.1
f1 ,
f2 ,
x1 , x2 , x3 , , xk , k marcas de clases con frecuencias de clases f 3 , , f k respectivamente, en una distribución de frecuencias. Entonces la varianza es
Sean
s2
1 k ( xi x ) 2 f i n 1 i 1
Ecuación 2.1 Varianza muestral para datos agrupados. Con muestra n, con k marcas de clases correspondientes a las frecuencias f
Donden f1 f 2 f 3 f k .
______________________________________________________________________________________ UNIVERSIDAD DE PAMPLONA-.Facultad de Estudios a Distancia. Pág 1 Taller 2 Estadística descriptiva – Aries Álvarez león .
En el caso,
f1 f 2 f 3 f k 1 entonces los datos se dicen no agrupados. Así, la fórmula para
1 n ( xi x ) 2 n 1 i 1
la varianzase convierte en
s2
Ecuación 2.2 varianza muestral para datos no agrupados. Con muestra n Para el caso anterior si deseamos trabajar con grupos o población muy pequeña donde la muestra es igual a la población, se tomará n-1 = N, entonces quedaría así
s2
1 n ( xi x ) 2 N i 1
Ecuación 2.3 varianza poblacional para datos no agrupados. Con población N La razón para que seutilice n – 1 en el denominador, en vez de n, obedece al hecho de que si se toman muchas muestras de una población dada, y se calcula sus respectivas varianzas, y se promedia estos dos resultados, entonces este promedio no tiende a igualarse a la varianza poblacional, a menos que n su cálculo se utilice n – 1 en el denominador. La varianza es útil en la comparación de la variación relativa de dosconjuntos de mediciones, pero sólo aporta información con respecto a la variación en un solo conjunto cuando se interpreta en términos de la desviación estándar. La desviación estándar de un conjunto de medidas es la raíz cuadrada positiva de la varianza, es decir,
s s2
Ecuación 2.4 Desviación estándar muestral
La varianza y la desviación estándar no son medidas de variabilidad distintas,debido a que la última no puede determinarse a menos que se conozca la primera. A menudo se prefiere la desviación estándar en relación con la varianza, porque se expresa en las mismas unidades físicas de las observaciones. Otra medida útil de la variabilidad tiene base en el valor absoluto de las diferencias entres el conjunto de mediciones y la media o la mediana, dependiendo de cual de las dos seemplee como medida de tendencia central. Definición 2.2 Sean
f1 ,
f2 ,
x1 , x2 , x3 , , xk , k marcas de clases con frecuencias de clases f 3 , , f k respectivamente, en una distribución de frecuencias. Entonces la desviación
1 k | xi x | f i n i 1
media está dada por
D.M .
Ecuación 2.5 desviación media para datos agrupados. Con muestra n, con k marcas de clases...
Regístrate para leer el documento completo.