Las pruebas de hipótesis o pruebas de significación implican el cálculo de un número conocido como valor p. Este número es muy importante para la conclusión de nuestra prueba. Los valores P están relacionados con el estadístico de prueba y nos dan una medida de la evidencia contra la hipótesis nula.
Hipótesis nulas y alternativas
Todas las pruebas de significación estadística comienzan con un nula y una hipótesis alternativa. La hipótesis nula es la declaración de ningún efecto o una declaración del estado de cosas comúnmente aceptado. La hipótesis alternativa es lo que estamos intentando demostrar. La suposición de trabajo en una prueba de hipótesis es que la hipótesis nula es verdadera.
Estadística de prueba
Asumiremos que se cumplen las condiciones para la prueba particular con la que estamos trabajando. UN muestra aleatoria simple nos da datos de muestra. A partir de estos datos podemos calcular una estadística de prueba. Las estadísticas de prueba varían mucho según los parámetros que conciernen a nuestra prueba de hipótesis. Algunas estadísticas de prueba comunes incluyen:
- z - estadística para pruebas de hipótesis sobre la media de la población, cuando conocemos la desviación estándar de la población.
- t - estadística para pruebas de hipótesis sobre la media de la población, cuando no conocemos la desviación estándar de la población.
- t - estadística para pruebas de hipótesis sobre la diferencia de dos medias de población independientes, cuando no conocemos la desviación estándar de ninguna de las dos poblaciones.
- z - estadística para pruebas de hipótesis sobre una proporción de la población.
- Chi-cuadrado - estadística para pruebas de hipótesis sobre la diferencia entre un recuento esperado y real para datos categóricos.
Cálculo de valores P
Las estadísticas de prueba son útiles, pero puede ser más útil asignar un valor p a estas estadísticas. Un valor p es la probabilidad de que, si la hipótesis nula fuera cierta, observaríamos una estadística al menos tan extrema como la observada. Para calcular un valor p, utilizamos el software apropiado o la tabla estadística que corresponde con nuestra estadística de prueba.
Por ejemplo, usaríamos un distribución normal estándar al calcular un z Estadística de prueba. Valores de z con valores absolutos grandes (como los superiores a 2.5) no son muy comunes y darían un valor p pequeño. Valores de z que están más cerca de cero son más comunes y darían valores p mucho más grandes.
Interpretación del valor P
Como hemos señalado, un valor p es una probabilidad. Esto significa que es un número real de 0 y 1. Mientras que una estadística de prueba es una forma de medir cuán extrema es una estadística para una muestra en particular, los valores p son otra forma de medir esto.
Cuando obtenemos una muestra estadística dada, la pregunta que siempre debemos hacer es: “¿Es esta muestra como es por casualidad? solo con una verdadera hipótesis nula, ¿o es falsa la hipótesis nula? Si nuestro valor p es pequeño, esto podría significar uno de dos cosas:
- La hipótesis nula es cierta, pero tuvimos mucha suerte de obtener nuestra muestra observada.
- Nuestra muestra es la forma en que se debe al hecho de que la hipótesis nula es falsa.
En general, cuanto menor es el valor p, más evidencia tenemos contra nuestra hipótesis nula.
¿Qué tan pequeño es lo suficientemente pequeño?
¿Qué tan pequeño de un valor p necesitamos para poder rechazar la hipótesis nula? La respuesta a esto es: "Depende". Una regla general común es que el valor p debe ser menor o igual a 0.05, pero no hay nada universal en este valor.
Por lo general, antes de realizar una prueba de hipótesis, elegimos un valor umbral. Si tenemos un valor p que es menor o igual a este umbral, entonces rechazamos la hipótesis nula. De lo contrario, no podemos rechazar la hipótesis nula. Este umbral se denomina nivel de significación de nuestra prueba de hipótesis y se denota con la letra griega alfa. No hay valor de alfa eso siempre define la significación estadística.