Medidas de dispersión

De una manera complementaria a las medidas de centralización, estas medidas de dispersión permiten conocer cuán heterogéneos son los datos entre sí y que tan dispersos se encuentran los valores alrededor del centro de la muestra. Por tanto, mientras más alto sea el valor de estas medidas, más datos diferentes existirán, y de ser un valor bajo, los datos estarán más agrupados hacia el centro. Algunas de estas medidas son la desviación estándar, la varianza, el rango de la muestra, etc.

Rango de la muestra e intercuartil (Rango/RIQ):

El rango de una muestra de n elementos, esta definida por la diferencia entre el valor máximo y el valor mínimo de la serie de datos.

Mientras que, el rango intercuartil (RIQ) es la diferencia entre el cuartil superior e inferior.

Ambas medidas permiten estimar la dispersión de los datos, si los valores son muy altos, existe una mayor probabilidad de encontrar más datos heterogéneos entre sí.

Desviación estándar (s):

De manera concreta, la desviación estándar (s), de trata de la distancia promedio que existe entre cada uno de los datos y la media aritmética, siendo un valor positivo que indica cuán representativa es la media aritmética. De un valor muy alto, la media no es muy significativa para ese conjunto de datos; y de ser bajo, indica una mayor concentración de los datos hacia el centro.

Para datos individuales: