Que es la distribucion de frecuencias

Por distribución o distribucion de frecuencias se conoce al conjunto de valores que puede tomar una variable, ordenadas de mayor a menor o viceversa y y acompañado de sus frecuencias absolutas.

En este articulo vamos a ver las anotaciones habituales en la distribucion de frecuencias, que son las frecuencias estadisticas y los diferentes tipos de graficos, todo explicado con diferentes ejemplos para entenderlo de forma mas sencilla.

La anotaciones habituales en la distribucion de frecuencias

Estas son las anotaciones habituales en una distribucion de frecuencas en estadistica.

  • X (mayúscula): la variable o característica objeto de estudio.
  • xi (minúscula): el valor que toma la variable o característica X para el individuo i.
  • r: el numero de valores distintos que toma una variable, se utiliza tb el símbolo “k”
  • ni: el nº de veces o frecuencia con la que aparece un determinado valor xi.
  • N: el nº de unidades en las cuales efectuamos la medición o disponemos de datos.
  • n: el total de datos referidos a una muestra de dicha población.

Ejemplo de distribucion de frecuencias

Por ejemplo se tira un dado 100 veces y obtenemos los siguientes resultados:

10 Veces un 1; 15 veces un 2; 25 veces un 3; 30 veces un 4; 15 veces un 5; y 5 veces un 6.

En este caso, la x minúscula tomaría los valores del 1 al 6. La N mayúscula seria igual a 100 y la minúscula seria para N1 tendría un valor de 10, para N2 tendría un valor de 15 y así sucesivamente.

La frecuencia estadistica

Las distribuciones de frecuencia pueden ser tanto unidimensionales como bidimensionales o multidimensionales, según se observen una, dos o múltiples características de la población.

Una frecuencia estadística es la cantidad de veces que se repite un determinado valor en una variable:

Existen cinco tipos diferentes de frecuencias estadísticas, que son:

  • Frecuencia absoluta ni : Es el numero total de veces que un valor se presenta cuando se trata de una variable. Si es un atributo sera el numero de veces que se presenta un carácter o modalidad. La suma total de las frecuencias absolutas tiene que ser igual a la muestra estudiada, N.
  • Frecuencia total o tal de datos N: Tal y como hemos dicho antes, es la suma total de las frecuencias absolutas.
  • Frecuencia relativa fi: Es el cociente entre la frecuencia absoluta con la frecuencia total de datos. La formula seria ni/N. La suma de todas las frecuencias relativas siempre sera 1 o el 100%.
  • Frecuencia absoluta acumulada Ni: Es la frecuencia absoluta del valor mas la suma de las frecuencias absolutas de todos los valores anteriores. Sera necesario que la distribución este previamente ordenada. A continuación tienes un ejemplo de frecuencia absoluta acumulada:

xi

ni

Ni

1

5

5

2

7

5+7=12

  • Frecuencia relativa acumulada F: Es el cociente entre la frecuencia absoluta acumulada y el número total de datos, N.

Los datos estadisticos

Los datos estadísticos se representan normalmente de tres formas diferentes, que llamaremos Tipo I (o unitarias), Tipo II y Tipo III.

En el Tipo I, o distribuciones unitarias, los valores no se repiten nunca. Por ejemplo, la medida de cinco personas en centímetros son las siguientes; 175,185 y 180

X1, X2, X3, …, Xn | En el ejemplo anterior seria 175, 180 y 185

Ahora vamos a ver como quedaría una tabla de frecuencias del ejemplo anterior:

Xi ni Ni fi Fi
175 1  1 33% 33%
180 1 2 33% 66%
185 1 3 33% 100%

En las distribuciones de tipo II la característica medida si que se repite un determinado numero de veces. Al ejemplo anterior le vamos a añadir siete personas mas, que miden 170, 165, 160, 175, 190, 180, 175.

Ahora vamos a ver como quedaría la tabla de frecuencias del ejemplo anterior.

Xi ni Ni fi Fi
160 1 1 10% 10%
165 1 2 10% 20%
170 1 3 10% 30%
175 3 6 30% 60%
180 2 8 20% 80%
185 1 9 10% 90%
190 1 10 10% 100%

Cuando el numero de variables tienen una gran cantidad de valores, es conveniente agrupar esos valores en intervalos o clases, a este tipo de clasificación se le llama distribución de Tipo III. Al ejemplo anterior le vamos a añadir todavía mas personas, exactamente 20, que miden 150, 155, 160, 180, 190, 195, 200, 175, 180, 185, 155, 160, 160, 185, 195, 150, 155, 180, 175, 170.

Ahora vamos a agrupar los valores por intervalos de 10 y crearemos la tabla de frecuencias, pero antes de esto debemos tener claros un par de conceptos. Por unta parte, denominamos amplitud de intervalo a la diferencia entre los dos extremos del intervalo. Por otra parte, llamaremos marca de clase al punto medio de cada intervalo. La notación empleada para los intervalos es:

Li representa el limite superior, Li-1 representa el limite inferior, Ci es la amplitud del intervalo y mi es la marca de clase

La formula para calcular la marca de clase seria la siguiente:

mi = (Li-1+Li)/2

Ahora si, vamos a crear la tabla de frecuencias.

Li-1 – Li ni Ni fi Fi
[150 – 160] 9 9 30% 30%
(160 – 170] 3 12 10% 40%
(170 – 180] 10 22 33% 73%
(180 – 190] 5 27 17% 90%
(190 – 200] 3 30 10% 100%

Hay que tener en cuenta que los intervalos pueden ser abiertos o cerrados por sus extremos. En la tabla de frecuencias anterior el corchete significa que el valor queda dentro del intervalo, y el paréntesis que queda fuera. Por ejemplo, (160 – 170] significa que el intervalo incluye desde 161 hasta 170, pero no 160, que queda incluido en el intervalo anterior [150 – 160].

Tipos de graficos

Ahora solo nos queda ver como se pueden representar una distribucion de frecuencias, para ello vamos a ver los diferentes tipos de gráficos mas utilizados.

  • Los gráficos de barras: Suelen utilizarse para variables discretas en distribuciones de frecuencias en los cuales los datos estén sin agrupar (de tipo I y tipo II). A continuación puedes ver un gráfico de barras en el que se representan las ventas de una empresa en los doce meses del año.
  • Los diagramas de barras: Es como el gráfico de barras, pero permite comparar varios fenómenos estudiados. Vamos a comparar las ventas de la empresa anterior, que llamaremos ¨Empresa A¨, y la empresa de la competencia, que llamaremos ¨Empresa B¨.
  • Los histogramas: Son muy parecidos a los gráficos de barras pero en el que se ven los datos agrupados. Por ejemplo, vamos a ver el numero de meses que la ¨Empresa A¨ alcanza unos ciertos volúmenes de facturación.
  • Los polígonos de frecuencias: Suelen utilizarse en tablas de frecuencias de Tipo II, pero se pueden utilizar en cualquier tipo. Vamos a ver el ejemplo anterior en un polígono de frecuencias.
  • Los gráficos de sectores: Los conocidos tradicionalmente como quesitos, se utilizan para mostrar que contribución realiza cada una de las partes al total de la serie. Siguiendo con nuestro ejemplo, ahora imaginemos que vamos a separar la facturación de la empresa que estamos analizando por la localización de sus ventas. Primero deberemos separar el importe total de las ventas por países, luego ver que porcentaje representa del total ventas, y por ultimo haremos la representación gráfica que quedara como en la imagen siguiente.
  • Gráficos de series temporales: En este tipo de gráficos se representan los valores ordenados según la secuencia temporal. A continuación vamos a ver la evolución de la facturación en la empresa de nuestro ejemplo a través de los años.

Existen otros, como el diagrama de pareto, el de tallos y hojas, etc, pero los mas conocidos y utilizados para representar la distribucion de frecuencias creo que son estos que he señalado.

Respuestas en la misma categoria