De una manera complementaria a las medidas de centralización, estas medidas de dispersión permiten conocer cuán heterogéneos son los datos entre sí y que tan dispersos se encuentran los valores alrededor del centro de la muestra. Por tanto, mientras más alto sea el valor de estas medidas, más datos diferentes existirán, y de ser un valor bajo, los datos estarán más agrupados hacia el centro. Algunas de estas medidas son la desviación estándar, la varianza, el rango de la muestra, etc.
- Rango de la muestra e intercuartil (Rango/RIQ):
El rango de una muestra de n elementos, esta definida por la diferencia entre el valor máximo y el valor mínimo de la serie de datos.
Mientras que, el rango intercuartil (RIQ) es la diferencia entre el cuartil superior e inferior.
Ambas medidas permiten estimar la dispersión de los datos, si los valores son muy altos, existe una mayor probabilidad de encontrar más datos heterogéneos entre sí.
- Desviación estándar (s):
De manera concreta, la desviación estándar (s), de trata de la distancia promedio que existe entre cada uno de los datos y la media aritmética, siendo un valor positivo que indica cuán representativa es la media aritmética. De un valor muy alto, la media no es muy significativa para ese conjunto de datos; y de ser bajo, indica una mayor concentración de los datos hacia el centro.
Para datos individuales:
Para datos agrupados:
- Varianza (s²):
Se define como el cuadrado de la desviación estándar, de la siguiente manera:
Para datos individuales:
Para datos agrupados:
- Coeficiente de variación (CV, %CV):
Es la relación entre la desviación estándar y la media aritmética:
Además, para esta medida se considera lo siguiente:
- Si CV < 20%, o, CV = 20%, los datos son más homogéneos entre sí.
- Si CV > 20%, los datos son más heterogéneos entre sí.
Comentarios
Publicar un comentario