Los intervalos de confianza son una parte clave de las estadísticas inferenciales. Podemos usar alguna probabilidad e información de un Distribución de probabilidad estimar un parámetro de población con el uso de una muestra. La declaración de un intervalo de confianza se hace de tal manera que se malinterpreta fácilmente. Examinaremos la interpretación correcta de los intervalos de confianza e investigaremos cuatro errores que se cometen con respecto a esta área de las estadísticas.
¿Qué es un intervalo de confianza?
Un intervalo de confianza se puede expresar como un rango de valores o en la siguiente forma:
Estimación ± Margen de error
Un intervalo de confianza generalmente se establece con un nivel de confianza.Niveles de confianza comunes son 90%, 95% y 99%.
Veremos un ejemplo en el que queremos usar una media muestral para inferir la media de una población. Supongamos que esto resulta en un intervalo de confianza de 25 a 30. Si decimos que estamos 95% seguros de que la población desconocida
media está contenido en este intervalo, entonces realmente estamos diciendo que encontramos el intervalo usando un método que es exitoso en dar resultados correctos el 95% del tiempo. A la larga, nuestro método no tendrá éxito el 5% del tiempo. En otras palabras, no lograremos capturar la verdadera población, lo que significa solo una de cada 20 veces.Error # 1
Ahora veremos una serie de errores diferentes que se pueden cometer cuando se trata de intervalos de confianza. Una afirmación incorrecta que a menudo se hace sobre un intervalo de confianza con un nivel de confianza del 95% es que existe una probabilidad del 95% de que el intervalo de confianza contenga la media real de la población.
La razón de que esto sea un error es realmente bastante sutil. La idea clave de un intervalo de confianza es que la probabilidad utilizada entra en escena con El método que se utiliza para determinar el intervalo de confianza es que se refiere al método usado.
Error # 2
Un segundo error es interpretar que un intervalo de confianza del 95% dice que el 95% de todos los valores de datos en la población se encuentran dentro del intervalo. Nuevamente, el 95% habla sobre el método de la prueba.
Para ver por qué la afirmación anterior es incorrecta, podríamos considerar una población normal con un Desviación Estándar de 1 y una media de 5. Una muestra que tenía dos puntos de datos, cada uno con valores de 6 tiene una media muestral de 6. Un intervalo de confianza del 95% para la media de la población sería de 4.6 a 7.4. Esto claramente no se superpone con el 95% de la distribución normal, por lo que no contendrá el 95% de la población.
Error # 3
Un tercer error es decir que un intervalo de confianza del 95% implica que el 95% de todos los medios de muestra posibles se encuentran dentro del rango del intervalo. Reconsidere el ejemplo de la última sección. Cualquier muestra de tamaño dos que estuviera compuesta solo por valores menores a 4.6 tendría una media menor a 4.6. Por lo tanto, estas medias muestrales quedarían fuera de este intervalo de confianza particular. Las muestras que coinciden con esta descripción representan más del 5% del monto total. Por lo tanto, es un error decir que este intervalo de confianza captura el 95% de todas las medias muestrales.
Error # 4
Un cuarto error al tratar con los intervalos de confianza es pensar que son la única fuente de error. Si bien hay un margen de error asociado con un intervalo de confianza, hay otros lugares donde los errores pueden colarse en un análisis estadístico. Un par de ejemplos de este tipo de errores podrían deberse a un diseño incorrecto del experimento, sesgo en el muestreo o incapacidad para obtener datos de un determinado subconjunto de la población.