los mediana de un conjunto de datos es el punto intermedio en el que exactamente la mitad de los valores de los datos son menores o iguales a la mediana. De manera similar, podemos pensar en la mediana de un continuoDistribución de probabilidad, pero en lugar de encontrar el valor medio en un conjunto de datos, encontramos el medio de la distribución de una manera diferente.
El área total bajo una función de densidad de probabilidad es 1, que representa el 100%, y como resultado, la mitad de esta puede representarse por la mitad o el 50 por ciento. Una de las grandes ideas de la estadística matemática es que la probabilidad está representada por el área bajo la curva de función de densidad, que se calcula por una integral, y por lo tanto la mediana de una distribución continua es el punto en el Número Real línea donde exactamente la mitad del área se encuentra a la izquierda.
Esto puede establecerse de manera más sucinta mediante la siguiente integral impropia. La mediana de la variable aleatoria continua X con función de densidad F( X) es el valor M tal que:
0.5=∫metro−∞F(X)reX
Mediana de distribución exponencial
Ahora calculamos la mediana de la distribución exponencial Exp (A). Una variable aleatoria con esta distribución tiene función de densidad F(X) = mi-X/UN/ A para X cualquier número real no negativo. La función también contiene el constante matemática mi, aproximadamente igual a 2.71828.
Como la función de densidad de probabilidad es cero para cualquier valor negativo de X, todo lo que debemos hacer es integrar lo siguiente y resolver M:
0.5 = M0M f (x) dx
Desde la integral ∫ mi-X/UN/ A dX = -mi-X/UN, el resultado es que
0.5 = -e-M / A + 1
Esto significa que 0.5 = mi-MAMÁ y después de tomar el logaritmo natural de ambos lados de la ecuación, tenemos:
ln (1/2) = -M / A
Desde 1/2 = 2-1, por propiedades de logaritmos escribimos:
- ln2 = -M / A
Multiplicar ambos lados por A nos da el resultado de que la mediana M = A ln2.
Desigualdad media-media en estadística
Debe mencionarse una consecuencia de este resultado: la media de la distribución exponencial Exp (A) es A, y dado que ln2 es menor que 1, se deduce que el producto Aln2 es menor que A. Esto significa que la mediana de la distribución exponencial es menor que la media.
Esto tiene sentido si pensamos en la gráfica de la función de densidad de probabilidad. Debido a la larga cola, esta distribución está sesgada a la derecha. Muchas veces, cuando una distribución está sesgada a la derecha, la media está a la derecha de la mediana.
Lo que esto significa en términos de análisis estadístico es que a menudo podemos predecir que la media y la mediana no correlacionar dada la probabilidad de que los datos estén sesgados a la derecha, lo que se puede expresar como la prueba de desigualdad de mediana y media conocido como Desigualdad de Chebyshev.
Como ejemplo, considere un conjunto de datos que postula que una persona recibe un total de 30 visitantes en 10 horas, donde el tiempo de espera promedio para un visitante es de 20 minutos, mientras que el conjunto de datos puede presentar que el tiempo medio de espera sería entre 20 y 30 minutos si más de la mitad de esos visitantes vinieran en los primeros cinco horas