Ir al contenido principal

Medidas de dispersión

De una manera complementaria a las medidas de centralización, estas medidas de dispersión permiten conocer cuán heterogéneos son los datos entre sí y que tan dispersos se encuentran los valores alrededor del centro de la muestra. Por tanto, mientras más alto sea el valor de estas medidas, más datos diferentes existirán, y de ser un valor bajo, los datos estarán más agrupados hacia el centro. Algunas de estas medidas son la desviación estándar, la varianza, el rango de la muestra, etc. 

  • Rango de la muestra e intercuartil (Rango/RIQ):

El rango de una muestra de n elementos, esta definida por la diferencia entre el valor máximo y el valor mínimo de la serie de datos. 

Mientras que, el rango intercuartil (RIQ) es la diferencia entre el cuartil superior e inferior. 

Ambas medidas permiten estimar la dispersión de los datos, si los valores son muy altos, existe una mayor probabilidad de encontrar más datos heterogéneos entre sí. 

  • Desviación estándar (s):

De manera concreta, la desviación estándar (s), de trata de la distancia promedio que existe entre cada uno de los datos y la media aritmética, siendo un valor positivo que indica cuán representativa es la media aritmética. De un valor muy alto, la media no es muy significativa para ese conjunto de datos; y de ser bajo, indica una mayor concentración de los datos hacia el centro. 

Para datos individuales:

Para datos agrupados:

  • Varianza (s²):

Se define como el cuadrado de la desviación estándar, de la siguiente manera:

Para datos individuales:

Para datos agrupados:

  • Coeficiente de variación (CV, %CV):

Es la relación entre la desviación estándar y la media aritmética:

Además, para esta medida se considera lo siguiente:

  • Si CV < 20%, o, CV = 20%, los datos son más homogéneos entre sí.
  • Si CV > 20%, los datos son más heterogéneos entre sí.



Comentarios

Entradas más populares de este blog

Variable cuantitativa - Número de Electrodomésticos

Al registrar las respuestas para la pregunta sobre el número de electrodomésticos en el hogar de las personas encuestadas, de una forma similar al número de integrantes en la familia se agrupó a los datos en la siguiente tabla, esta vez por intervalos de clase: Del histograma se puede inferir que una gran parte de las personas encuestadas en Las Orquídeas (14 individuos) tienen entre 5 y 10 electrodomésticos en su vivienda. Esto influye directamente en el consumo de estos en energía eléctrica. Este intervalo además se puede clasificar directamente como la clase modal y aparentemente, en donde también se encontrará la media aritmética y mediana, debido a que la distribución de datos tiende a ser simétrica. Debido a que la mediana es muy parecida a la media aritmética, y ambas se encuentran dentro de la clase modal, se puede inferir que se trata de una media muy representativa para el conjunto de datos, además de encontrarse con una distribución simétrica de ellos. Ahora bien, se puede a...

Variables Cualitativas

 Para la encuesta se eligieron cinco variables cualitativas, y sus respuestas se encuentran detalladas a continuación: X 1 : Genero del encuestado X 2 : Estado civil X 3 : Horario de mayor consumo X 4 : Mes de mayor gasto eléctrico X 5 : Personas en modalidad de trabajo o estudio virtual X 6 : Fuentes de energía ante apagones X 7 : Medidas para la reducción de consumo Se omiten la tabla y el gráfico de la variable X 8 puesto que se obtuvo que la unica fuente de energía usada por la muestra elegida proviene de la red pública.

Medidas de Forma

 Al graficar un conjunto de datos en un histograma y obtener un polígono de frecuencias asociado, se puede apreciar la forma que toma la distribucion de los datos de manera ordenada. Para describir la forma que tiene esta curva, se usan las medidas de forma. Coeficiente de Asimetría El coeficiente de asimetría indica a que lado de la distribución se acumula la mayor cantidad de datos. Se puede decir que existen tres tipos de distribución, la simétrica, asimétrica a la derecha y asimétrica a la izquierda. Coeficiente de Apuntamiento Otra medida de forma es el coeficiente de apuntamiento o curtosis. Este indica que tan concentrados se encuentran los datos en el punto mas alto de la distribución. Cuando se presenta una distribucion puntiaguda se dice que es leptocúrtica, mientras que mas plano se llama platicúrtica. En sí, se suele buscar que la curva de distribución sea normal o gaussiana, es decir, completamente simétrica.