Es la proyección de medianoche de la película más reciente. Las personas están en fila afuera del teatro esperando para entrar. Supongamos que se le pide que encuentre el centro de la línea. ¿Cómo harías esto?
Hay un par de formas diferentes de hacerlo resolviendo este problema. Al final, tendría que averiguar cuántas personas había en la fila y luego tomar la mitad de ese número. Si el número total es par, entonces el centro de la línea estaría entre dos personas. Si el número total es impar, entonces el centro sería una sola persona.
Puede preguntar: "¿Qué tiene que ver encontrar el centro de una línea con Estadísticas? "Esta idea de encontrar el centro es exactamente lo que se usa al calcular la mediana de un conjunto de datos.
¿Cuál es la mediana?
La mediana es una de las tres formas principales de encontrar el promedio de Datos estadísticos. Es más difícil de calcular que el modo, pero no tan laborioso como calcular la media. Es el centro de la misma manera que encontrar el centro de una línea de personas. Después de enumerar los valores de datos en orden ascendente, la mediana es el valor de datos con el mismo número de valores de datos por encima y por debajo.
Caso uno: un número impar de valores
Se prueban once baterías para ver cuánto duran. Sus vidas, en horas, están dadas por 10, 99, 100, 103, 103, 105, 110, 111, 115, 130, 131. ¿Cuál es la mediana de vida? Como hay un número impar de valores de datos, esto corresponde a una línea con un número impar de personas. El centro será el valor medio.
Hay once valores de datos, por lo que el sexto está en el centro. Por lo tanto, la duración media de la batería es el sexto valor en esta lista, o 105 horas. Tenga en cuenta que la mediana es uno de los valores de datos.
Caso dos: un número par de valores
Se pesan veinte gatos. Sus pesos, en libras, están dados por 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 8, 8, 9, 10, 10, 10, 11, 12, 12, 13. ¿Cuál es el peso medio del felino? Como hay un número par de valores de datos, esto corresponde a la línea con un número par de personas. El centro está entre los dos valores medios.
En este caso, el centro se encuentra entre los valores de datos décimo y undécimo. Para encontrar la mediana calculamos la media de estos dos valores y obtenemos (7 + 8) / 2 = 7.5. Aquí la mediana no es uno de los valores de datos.
¿Algún otro caso?
Las únicas dos posibilidades son tener un número par o impar de valores de datos. Entonces, los dos ejemplos anteriores son las únicas formas posibles de calcular la mediana. O la mediana será el valor medio, o la mediana será el media de los dos valores medios Por lo general, los conjuntos de datos son mucho más grandes que los que vimos anteriormente, pero el proceso de encontrar la mediana es el mismo que estos dos ejemplos.
El efecto de los valores atípicos
La media y el modo son muy sensibles a los valores atípicos. Lo que esto significa es que la presencia de un valor atípico afectará dramáticamente ambas medidas del centro. Una ventaja de la mediana es que no está influenciada tanto por un valor atípico.
Para ver esto, considere el conjunto de datos 3, 4, 5, 5, 6. La media es (3 + 4 + 5 + 5 + 6) / 5 = 4.6, y la mediana es 5. Ahora mantenga el mismo conjunto de datos, pero agregue el valor 100: 3, 4, 5, 5, 6, 100. Claramente, 100 es un valor atípico, ya que es mucho mayor que todos los demás valores. La media del nuevo conjunto es ahora (3 + 4 + 5 + 5 + 6 + 100) / 6 = 20.5. sin embargo, el mediana del nuevo conjunto es 5. Aunque el
Aplicación de la mediana
Debido a lo que hemos visto anteriormente, la mediana es la medida preferida del promedio cuando los datos contienen valores atípicos. Cuando se informan los ingresos, un enfoque típico es informar el ingreso medio. Esto se hace porque el ingreso medio está sesgado por un pequeño número de personas con ingresos muy altos (piense Bill Gates y Oprah).