La regla del rango intercuartil es útil para detectar la presencia de valores atípicos. Valores atípicos son valores individuales que quedan fuera del patrón general de un conjunto de datos. Esta definición es algo vaga y subjetiva, por lo que es útil tener una regla para aplicar cuando determinar si un punto de datos es realmente un valor atípico: aquí es donde rige el rango intercuartil viene en.
Cualquier conjunto de datos puede describirse por su resumen de cinco números. Estos cinco números, que le brindan la información que necesita para encontrar patrones y valores atípicos, consisten en (en orden ascendente):
Estos cinco números le dicen a una persona más sobre sus datos que mirarlos todos a la vez, o al menos hacer esto mucho más fácil. Por ejemplo, el rango, que es el mínimo restado del máximo, es un indicador de cuán dispersos están los datos en un conjunto (nota: el rango es altamente sensible a los valores atípicos: si un valor atípico es también un mínimo o un máximo, el rango no será una representación precisa de la amplitud de los datos conjunto).
El rango sería difícil de extrapolar de otra manera. Similar al rango pero menos sensible a los valores atípicos es el rango intercuartil. los rango intercuartil se calcula de la misma manera que el rango. Todo lo que debe hacer para encontrarlo es restar el primer cuartil del tercer cuartil:
El rango intercuartil muestra cómo se distribuyen los datos sobre la mediana. Es menos susceptible que el rango de valores atípicos y, por lo tanto, puede ser más útil.
Aunque a menudo no se ve muy afectado por ellos, el rango intercuartil puede usarse para detectar valores atípicos. Esto se hace siguiendo estos pasos:
Recuerde que la regla intercuartil es solo una regla general que generalmente se cumple pero no se aplica a todos los casos. En general, siempre debe seguir su análisis de valores atípicos estudiando los valores atípicos resultantes para ver si tienen sentido. Cualquier posible valor atípico obtenido por el método intercuartil debe examinarse en el contexto de todo el conjunto de datos.
Vea la regla de rango intercuartil en el trabajo con un ejemplo. Suponga que tiene el siguiente conjunto de datos: 1, 3, 4, 6, 7, 7, 8, 8, 10, 12, 17. El resumen de cinco números para este conjunto de datos es mínimo = 1, primer cuartil = 4, mediana = 7, tercer cuartil = 10 y máximo = 17. Puede mirar los datos y decir automáticamente que 17 es un valor atípico, pero ¿qué dice la regla del rango intercuartil?
Ahora multiplique su respuesta por 1.5 para obtener 1.5 x 6 = 9. Nueve menos que el primer cuartil es 4 - 9 = -5. Ningún dato es menor que esto. Nueve más que el tercer cuartil es 10 + 9 = 19. Ningún dato es mayor que esto. A pesar de que el valor máximo es cinco más que el punto de datos más cercano, la regla del rango intercuartil muestra que probablemente no debería considerarse un valor atípico para este conjunto de datos.