CUARTILES , DECILES , PERCENTILES

 

Cuartiles, deciles y percentiles

Imprime este documento

Aunque la varianza y desviación estándar son medidas de dispersión más útiles en análisis estadístico, existen otras técnicas con las cuales puede medirse la dispersión de un conjunto de datos. Estas medidas adicionales de dispersión son los cuartiles, los deciles y los percentiles.

 

Cuartiles

Son los valores de la variable que dividen los datos ordenados en cuartos; cada conjunto de datos tiene tres cuartiles. El primer cuartil, Q1, es un número tal que a lo mucho 25% de los datos son menores en el valor  que Q1 y a lo sumo 75% son mayores. El segundo cuartil,Q2 , es la mediana (50%). El tercer cuartil, Q3, es un número tal que a lo mucho 75% de los datos son menores en valor que Q3 y a lo sumo 25% son mayores.

 

Datos clasificados en orden ascendente

 

Cada conjunto de datos tiene tres cuartiles que lo dividen en cuatro partes iguales. El primer cuartil Q1 es ese valor debajo del cual clasifica el 25% de las observaciones, y sobre el cual puede encontrarse el 75% restante. El segundo cuartil Q2 es justo la  mitad. La mitad de las observaciones están por debajo y la mitad por encima; en este sentido, es lo mismo que la mediana. El tercer cuartil Q3 es el valor debajo del cual está el 75% de las observaciones y encima del cual puede encontrarse el 25% restante.

La determinación de los cuartiles con frecuencia es de utilidad. Por ejemplo muchas escuelas de posgrados admitirán sólo a aquellos estudiantes que estén en el 25% superior (tercer cuartil) de los candidatos.  Las empresas, con frecuencia, desean señalar las plantas cuyos deficientes registros de producción los colocan por debajo del cuartil inferior.

 

Deciles

Son valores de la variable que dividen los datos ordenados en diez partes iguales (9 divisiones).

 

Datos clasificados en orden ascendente

Percentiles

Son los valores de la variable que dividen un conjunto de datos en 100 subconjuntos iguales; cada conjunto de datos tiene 99 percentiles. El k-ésimo percentil, Pk, es un valor que a lo mucho k% de los datos son menores en valor que Pk y a lo sumo (100-k)% de los datos son mayores.

 

Datos clasificados en orden ascendente

                                                                     

Los deciles separan un conjunto de datos  en 10 subconjuntos iguales, y los percentiles en 100 partes. El  primer decil es la observación debajo de la cual se encuentra  el 10% de las observaciones, mientras que el 90% restante se encuentra encima de éste. El primer percentil es el valor debajo del cual se encuentra el 1% de las observaciones, y el resto están encima de éste. Puede aplicarse una interpretación similar al resto de deciles y percentiles. Todo conjunto de datos tiene 9 deciles y 99 percentiles. Un percentil y su ubicación en un arreglo ordenado se  identifican mediante los subíndices. Por ejemplo, el decimoquinto percentil se indica cómo  P15, y su ubicación en la serie ordenada es L15.

Para ilustrar el cálculo de percentiles, se asume que se tienen observaciones para el número de acciones correspondientes a 50 acciones negociados en la Bolsa de Mexicana de Valores, como se muestra en la siguiente tabla.

 

Número de acciones comerciadas en la BMV

3

10

19

27

34

38

48

56

67

74

4

12

20

29

34

39

48

59

67

74

7

14

21

31

36

43

52

62

69

76

9

15

25

31

37

45

53

63

72

79

10

17

27

34

38

47

56

64

73

80

 

Vale la pena destacar que los datos han sido puestos en una serie ordenada.

 

El lugar del P-ésimo percentil  se halla como se muestra a continuación:

 

Ubicación de un percentil:  

 

En donde:         Lp   es el lugar del percentil en una serie ordenada

                        n    es el número de observaciones

                        P    es el percentil deseado

 

Se asume que se desea calcular el percentil 25, P25, para las acciones de la tabla.

 

El valor resultante de 12.5 indica que el percentil 25 está ubicado al 75% del trayecto comprendido entre la doceava observación, que es 20 y la treceava observación, que es 21, es decir:

 

Si se desea calcular el percentil 35, se halla:

 

 

El percentil 35 está al 85% del trayecto comprendido entre la observación 17, que es 29 y la observación 18 que es 31, es decir . Por tanto el 35% de las observaciones está por debajo de 30.7 y el 65% restante por encima de 30.7.

 

Regresando a los deciles y cuartiles por un momento, se nota que el primer decil es igual a P10, el segundo decil es igual a P20 y así sucesivamente. Adicionalmente, el primer cuartil es igual a P25, el segundo cuartil es igual a P50, y P75, se encuentra en el tercer cuartil. Teniendo esto en mente, el cálculo de deciles y cuartiles se vuelve simplemente un asunto de determinación de los percentiles apropiados de acuerdo al procedimiento que acabamos de ver.    

 

Ejemplo:

Para la siguiente colección de datos 1, 1, 1, 2, 3, 3, 4, 4, 5, 9, 9, 19, 20 y 20 calcular:

 

a) El primero y tercer cuartil.
b) El octavo decil.
c) El percentil 42, el 50 y el 87.

 

Solución:

a) cuartiles

Para el cálculo de los cuartiles debemos determinar la posición del dato que ocupa cada cuartil con la condición de que dividan a la colección de datos en cuatro partes iguales. De esa forma notamos que el segundo cuartil coincide con la mediana dado que divide a la colección en dos partes iguales, por lo que su posición es  

 posición7.5

 

Esto significa que la mediana es 4. Ahora el primer cuartil es la mediana de los datos que se encuentra a la izquierda de la mediana o segundo cuartil. Así, la posición del primer cuartil es . Esto significa que el primer cuartil es el valor que está en la cuarta posición, es decir, 2. Del mismo modo el tercer cuartil es el valor que está en la cuarta posición desde el otro extremo, es decir, 9.

 

b) Deciles

En cuanto al decil, basta  con ubicar la posición en que se encuentra a través de la fórmula . Esto quiere decir que entre el dato que se encuentra en la posición 11 y la 12 está el octavo decil, pero más cerca de la 11 que de la 12, ya que la posición es la 11.2. El resultado seria 9.2 porque entre el 9 y el 19 ( que son los datos cuyas posiciones son 11 y 12 respectivamente) hay exactamente 10 unidades.

 

c) Percentiles

 

Con relación a los percentiles pedidos, tendremos que ubicar las posiciones correspondientes como lo hicimos con los deciles. Para la posición del percentil 42 tendríamos la siguiente fórmula . Esto quiere decir que el percentil 42 se encuentra entre los datos que ocupan la posición 5 y la 6. Afortunadamente en este caso ambos datos son 3 por lo que el percentil 42 es 3.

 

Como ya vimos, para el percentil 50 basta con buscar la mediana. La mediana de esta colección es 4. Por último, el percentil 87 se buscaría con el mismo procedimiento usado anteriormente, es decir,  nos daría la posición del percentil buscando que en este caso es entre las posiciones 12 y la 13, más cerca de la primera. El resultado sería que el percentil 87 toma el valor de 19.18.







Comentarios

Entradas populares