DISTRIBUCION DE FRECUENCIAS ABSOLUTAS Y RELATIVAS

 Una distribución de frecuencias en estadística se refiere a la tendencia que siguen los datos organizados en grupos, categorías o clases, cuando a cada una se le asigna un número denominado frecuencia, el cual indica cuántos datos hay en cada grupo. 

Los grupos que están por encima o por debajo de dicha categoría central disminuyen gradualmente su frecuencia, siendo muy pequeña o insignificante para las categorías más alejadas de la categoría con frecuencia mayor.

La forma de conocer la distribución de frecuencias de un conjunto de datos consiste en primer lugar en crear las categorías y luego hacer la tabla de frecuencias. La representación visual de la tabla de frecuencias se denomina histograma.


Tipos de frecuencia

Hay varios tipos de frecuencias:

1.- Frecuencia absoluta: es la más básica, y a partir de ella se construyen las demás. Consta simplemente del número total de datos correspondientes a una categoría.

2.- Frecuencia relativa: es la frecuencia absoluta de cada categoría dividida entre el número total de datos.

3.- Frecuencia porcentual: es la misma frecuencia relativa pero multiplicada por cien, indicando el porcentaje de aparición de valores en cada categoría.

4.- Frecuencia acumulada: es la suma de las frecuencias absolutas de las categorías inferiores o iguales a la categoría que se esté considerando. 

5.- Frecuencia acumulada porcentual: es la sumatoria de las frecuencias porcentuales de las categorías inferiores o iguales a la categoría que se esté observando.

Paso 1

Identificar el valor mínimo xmin y el valor máximo xmax en el conjunto de datos x.

Paso 2

Calcular el rango R, que se define como la diferencia entre el valor máximo menos el valor mínimo: R = xmax – xmin.

Paso 3

Determinar el número k de intervalos o clases, las cuales pueden estar preestablecidas. El número k determinará el número de filas que tendrá la tabla de frecuencias.

Paso 4

En caso de que el número de intervalos k no esté previamente dado, entonces debe establecerse de acuerdo a los siguientes lineamientos: el menor número de categorías recomendado es 5, pero puede ser mayor en cuyo caso es preferible elegir un número impar.

Paso 5

Hay una fórmula denominada regla de Sturges que nos da el número de intervalos k recomendado para un conjunto que consta de N datos:

k = [1 + 3,322⋅Log N]

Como el resultado dentro del corchete seguramente será un número real, el corchete nos indica que debe ser redondeado al entero impar más cercano para obtener un valor entero de k.

Paso 6

Se calcula la amplitud A de cada intervalo (clases o categorías) tomando el cociente entre el rango R y el número de intervalos kA = R/k. Si los datos originales son números enteros, entonces A se redondea al entero más próximo, de lo contrario se deja su valor real.

Paso 7

Determinar los límites inferior Li y superior Ls de cada intervalo o clase. El primer intervalo, o la clase más baja, tiene como límite inferior Li el más pequeño de los datos originales, es decir Li = xmin y como límite superior el valor mínimo más la amplitud del intervalo, esto es Ls = xmin + A. 

Paso 8

Los sucesivos intervalos son: 

[xmin, xmin + A), [ xmin + A, xmin + 2⋅A), …, [ xmin + (k-1)A, xmin + k⋅A).

Paso 9

Se determina la marca de clase Xc para cada intervalo, mediante la siguiente fórmula: Xc = (Ls – Li) / 2 + Li.

Paso 10

Se coloca el encabezado de la tabla de frecuencia, el cual consta de una fila con las siguientes etiquetas: clases, marca de clase Xc, frecuencia f, frecuencia relativa fr (o  frecuencia porcentual f%) y frecuencia acumulada F ( o frecuencia porcentual acumulada F%).

Lo que tendremos a continuación es lo siguiente:

Primera columna de la tabla de frecuencia: contiene los intervalos o clases en los que se han dividido los datos.

Segunda columna: contiene la marca de clase (o punto intermedio) de cada subintervalo.

Tercera columna: contiene la frecuencia absoluta f de cada clase o categoría.

Cuarta y quinta columna: se colocan los valores correspondientes a la frecuencia relativa (o porcentual) y a la frecuencia acumulada F (o acumulada porcentual).

Ejemplo de construcción de tabla

Los siguientes datos corresponden a las respuestas acertadas de un cuestionario de 100 preguntas aplicado a un grupo de 52 estudiantes:

65, 70, 70, 74, 61, 77, 85, 36, 70, 62, 62, 77, 80, 89, 39, 43, 70, 77, 79, 77, 88, 52, 85, 1, 55, 47, 73, 63, 59, 51, 56, 65, 85, 79, 53, 79, 3, 71, 7, 54, 8, 61, 61, 77, 67, 58, 61, 45, 48, 64, 15, 50.

Seguiremos los pasos para construir la tabla de frecuencia:

1.- Valores mínimo y máximo Xmin = 1, Xmax = 89.

2.- El rango es: R = 89 – 1 = 88

3.- Determinación del número de intervalos de acuerdo a la regla de Sturgesk = [1 + 3,322⋅Log 52] = [ 6,70] = 7.

4.- Cálculo del ancho de los intervalos: A = R / k = 88 / 7 =  12,57 ≈ 13.

5.- Los intervalos son: [1,14), [14, 27), [27, 40), [40, 53), [53, 66), [66, 79), [79, 92).

6.- Se determinan las marcas de clase de cada intervalo: 8, 21, 34, 47, 60, 73 y 86.

7.- Se hace la tabla:



Comentarios

Entradas populares