Ir al contenido principal

Medidas de dispersión

De una manera complementaria a las medidas de centralización, estas medidas de dispersión permiten conocer cuán heterogéneos son los datos entre sí y que tan dispersos se encuentran los valores alrededor del centro de la muestra. Por tanto, mientras más alto sea el valor de estas medidas, más datos diferentes existirán, y de ser un valor bajo, los datos estarán más agrupados hacia el centro. Algunas de estas medidas son la desviación estándar, la varianza, el rango de la muestra, etc. 

  • Rango de la muestra e intercuartil (Rango/RIQ):

El rango de una muestra de n elementos, esta definida por la diferencia entre el valor máximo y el valor mínimo de la serie de datos. 

Mientras que, el rango intercuartil (RIQ) es la diferencia entre el cuartil superior e inferior. 

Ambas medidas permiten estimar la dispersión de los datos, si los valores son muy altos, existe una mayor probabilidad de encontrar más datos heterogéneos entre sí. 

  • Desviación estándar (s):

De manera concreta, la desviación estándar (s), de trata de la distancia promedio que existe entre cada uno de los datos y la media aritmética, siendo un valor positivo que indica cuán representativa es la media aritmética. De un valor muy alto, la media no es muy significativa para ese conjunto de datos; y de ser bajo, indica una mayor concentración de los datos hacia el centro. 

Para datos individuales:

Para datos agrupados:

  • Varianza (s²):

Se define como el cuadrado de la desviación estándar, de la siguiente manera:

Para datos individuales:

Para datos agrupados:

  • Coeficiente de variación (CV, %CV):

Es la relación entre la desviación estándar y la media aritmética:

Además, para esta medida se considera lo siguiente:

  • Si CV < 20%, o, CV = 20%, los datos son más homogéneos entre sí.
  • Si CV > 20%, los datos son más heterogéneos entre sí.



Comentarios