La desigualdad de Chebyshev dice que al menos 1-1 /K2 de datos de una muestra debe estar dentro de K desviaciones estándar de la media (aquí K es positivo Número Real mayor que uno).
Cualquier conjunto de datos que se distribuye normalmente, o en forma de curva de campana, tiene varias características. Uno de ellos se ocupa de la difusión de los datos en relación con el número de desviaciones estándar de la media. En una distribución normal, sabemos que el 68% de los datos es una desviación estándar de la media, el 95% es dos desviaciones estándar de la media, y aproximadamente el 99% está dentro de tres desviaciones estándar de la media.
Pero si el conjunto de datos no se distribuye en forma de curva de campana, entonces una cantidad diferente podría estar dentro de una desviación estándar. La desigualdad de Chebyshev proporciona una forma de saber en qué fracción de los datos se encuentra K desviaciones estándar de la media para ninguna conjunto de datos
Hechos sobre la desigualdad
También podemos establecer la desigualdad anterior reemplazando la frase "datos de una muestra" con
Distribución de probabilidad. Esto se debe a que la desigualdad de Chebyshev es el resultado de la probabilidad, que luego se puede aplicar a las estadísticas.Es importante tener en cuenta que esta desigualdad es un resultado que se ha demostrado matemáticamente. No es como el relación empírica entre la media y el modo, o el regla de oro que conecta el rango y la desviación estándar.
Ilustración de la desigualdad
Para ilustrar la desigualdad, veremos algunos valores de K:
- por K = 2 tenemos 1 - 1 /K2 = 1 - 1/4 = 3/4 = 75%. Entonces, la desigualdad de Chebyshev dice que al menos el 75% de los valores de datos de cualquier distribución deben estar dentro de dos desviaciones estándar de la media.
- por K = 3 tenemos 1 - 1 /K2 = 1 - 1/9 = 8/9 = 89%. Entonces, la desigualdad de Chebyshev dice que al menos el 89% de los valores de datos de cualquier distribución deben estar dentro de tres desviaciones estándar de la media.
- por K = 4 tenemos 1 - 1 /K2 = 1 - 1/16 = 15/16 = 93.75%. Entonces, la desigualdad de Chebyshev dice que al menos el 93.75% de los valores de datos de cualquier distribución deben estar dentro de dos desviaciones estándar de la media.
Ejemplo
Supongamos que hemos muestreado los pesos de los perros en el refugio de animales local y descubrimos que nuestra muestra tiene una media de 20 libras con una desviación estándar de 3 libras. Con el uso de la desigualdad de Chebyshev, sabemos que al menos el 75% de los perros que muestreamos tienen pesos que son dos desviaciones estándar de la media. Dos veces la desviación estándar nos da 2 x 3 = 6. Resta y suma esto de la media de 20. Esto nos dice que el 75% de los perros tienen un peso de 14 libras a 26 libras.
Uso de la desigualdad
Si sabemos más acerca de la distribución con la que estamos trabajando, entonces generalmente podemos garantizar que más datos están a un cierto número de desviaciones estándar de la media. Por ejemplo, si sabemos que tenemos una distribución normal, entonces el 95% de los datos son dos desviaciones estándar de la media. La desigualdad de Chebyshev dice que en esta situación sabemos que al menos El 75% de los datos son dos desviaciones estándar de la media. Como podemos ver en este caso, podría ser mucho más que este 75%.
El valor de la desigualdad es que nos da un escenario de "peor caso" en el que lo único que sabemos sobre nuestros datos de muestra (o distribución de probabilidad) es la media y Desviación Estándar. Cuando no sabemos nada más sobre nuestros datos, la desigualdad de Chebyshev proporciona una idea adicional de cuán extendido es el conjunto de datos.
Historia de la desigualdad
La desigualdad lleva el nombre del matemático ruso Pafnuty Chebyshev, quien declaró la desigualdad por primera vez sin pruebas en 1874. Diez años después, Markov demostró la desigualdad en su doctorado. disertación. Debido a las variaciones en cómo representar el alfabeto ruso en inglés, Chebyshev también se escribe como Tchebysheff.