Prueba de hipótesis para comparar dos proporciones

En este artículo, veremos los pasos necesarios para realizar un prueba de hipotesis, o prueba de significación, para la diferencia de dos proporciones de población. Esto nos permite comparar dos proporciones desconocidas e inferir si no son iguales entre sí o si una es mayor que la otra.

Resumen y antecedentes de la prueba de hipótesis

Antes de entrar en los detalles de nuestra prueba de hipótesis, veremos el marco de las pruebas de hipótesis. En una prueba de significación intentamos mostrar que una declaración sobre el valor de una población parámetro (o, a veces, la naturaleza de la población misma) es probable que sea cierto.

Acumulamos evidencia para esta declaración mediante la realización de un muestra estadística. Calculamos una estadística de esta muestra. El valor de esta estadística es lo que usamos para determinar la verdad de la declaración original. Este proceso contiene incertidumbre, sin embargo, podemos cuantificar esta incertidumbre

El proceso general para una prueba de hipótesis viene dado por la siguiente lista:

instagram viewer

Asegúrese de que se cumplan las condiciones necesarias para nuestra prueba.
Indique claramente el hipótesis nulas y alternativas. La hipótesis alternativa puede implicar una prueba unilateral o bilateral. También debemos determinar el nivel de significación, que se denotará con la letra griega alfa.
Calcule la estadística de prueba. El tipo de estadística que utilizamos depende de la prueba particular que estamos realizando. El cálculo se basa en nuestra muestra estadística.
Calcula el valor p. El estadístico de prueba se puede traducir a un valor p. Un valor p es la probabilidad de que el azar produzca el valor de nuestro estadístico de prueba bajo el supuesto de que la hipótesis nula es verdadera. La regla general es que cuanto menor es el valor p, mayor es la evidencia contra la hipótesis nula.
Obtener una conclusión. Finalmente, usamos el valor de alfa que ya estaba seleccionado como valor umbral. La regla de decisión es que si el valor p es menor o igual que alfa, entonces rechazamos la hipótesis nula. De lo contrario nosotros fallo para rechazar La hipótesis nula.

Ahora que hemos visto el marco para una prueba de hipótesis, veremos los detalles de una prueba de hipótesis para la diferencia de dos proporciones de población.

Las condiciones

Una prueba de hipótesis para la diferencia de dos proporciones de población requiere que se cumplan las siguientes condiciones:

Tenemos dos muestras aleatorias simples de grandes poblaciones. Aquí "grande" significa que la población es al menos 20 veces mayor que el tamaño de la muestra. Los tamaños de muestra se denotarán por norte₁ y norte₂.
Los individuos en nuestras muestras han sido elegidos independientemente uno del otro. Las poblaciones mismas también deben ser independientes.
Hay al menos 10 éxitos y 10 fracasos en nuestras dos muestras.

Mientras se cumplan estas condiciones, podemos continuar con nuestra prueba de hipótesis.

Las hipótesis nulas y alternativas

Ahora debemos considerar las hipótesis para nuestra prueba de significación. La hipótesis nula es nuestra afirmación sin efecto. En este tipo particular de hipótesis, nuestra hipótesis nula es que no hay diferencia entre las dos proporciones de población. Podemos escribir esto como H₀: pag₁ = pag₂.

La hipótesis alternativa es una de tres posibilidades, dependiendo de los detalles de lo que estamos probando:

H_una: pag₁ es mayor que pag₂. Esta es una prueba de una cola o unilateral.
H_una: pag₁ es menos que pag₂. Esta también es una prueba unilateral.
H_una: pag₁ no es igual a pag₂. Esta es una de dos colas o prueba de dos lados.

Como siempre, para ser cautelosos, debemos usar la hipótesis alternativa de dos lados si no tenemos una dirección en mente antes de obtener nuestra muestra. La razón para hacer esto es que es más difícil rechazar la hipótesis nula con una prueba de dos lados.

Las tres hipótesis se pueden reescribir indicando cómo pag₁ - pag₂ está relacionado con el valor cero. Para ser más específicos, la hipótesis nula se convertiría en H₀:pag₁ - pag₂= 0. Las posibles hipótesis alternativas se escribirían como:

H_una: pag₁ - pag₂> 0 es equivalente a la declaración "pag₁ es mayor que pag₂."
H_una: pag₁ - pag₂<0 es equivalente a la declaración "pag₁ es menos que pag₂."
H_una: pag₁ - pag₂≠ 0 es equivalente a la declaración "pag₁ no es igual a pag₂."

Esta formulación equivalente en realidad nos muestra un poco más de lo que sucede detrás de escena. Lo que estamos haciendo en esta prueba de hipótesis es convertir los dos parámetros pag₁ y pag₂en el parámetro único pag₁ - pag_2. Luego probamos este nuevo parámetro contra el valor cero.

La estadística de prueba

La fórmula para el estadístico de prueba se da en la imagen de arriba. A continuación se explica cada uno de los términos:

La muestra de la primera población tiene tamaño norte_1.El número de éxitos de esta muestra (que no se ve directamente en la fórmula anterior) es k_1.
La muestra de la segunda población tiene tamaño norte_2.El número de éxitos de esta muestra es k_2.
Las proporciones de la muestra son p₁-sombrero = k₁ / n₁y P₂-hat = k₂ / n₂ .
Luego combinamos o agrupamos los éxitos de ambas muestras y obtenemos: p-hat = (k₁ + k₂) / (n₁+ n₂).

Como siempre, tenga cuidado con el orden de las operaciones al calcular. Todo debajo del radical debe calcularse antes de sacar la raíz cuadrada.

El valor p

El siguiente paso es calcular el valor p que corresponde a nuestra estadística de prueba. Utilizamos una distribución normal estándar para nuestra estadística y consultamos una tabla de valores o utilizamos software estadístico.

Los detalles de nuestro cálculo del valor p dependen de la hipótesis alternativa que estamos usando:

Para H_una: pag₁ - pag₂> 0, calculamos la proporción de la distribución normal que es mayor que Z.
Para H_una: pag₁ - pag₂<0, calculamos la proporción de la distribución normal que es menor que Z.
Para H_una: pag₁ - pag₂≠ 0, calculamos la proporción de la distribución normal que es mayor que |Z|, el valor absoluto de Z. Después de esto, para tener en cuenta el hecho de que tenemos una prueba de dos colas, duplicamos la proporción.

Regla de decisión

Ahora tomamos una decisión sobre si rechazar la hipótesis nula (y, por lo tanto, aceptar la alternativa), o no rechazar la hipótesis nula. Tomamos esta decisión comparando nuestro valor p con el nivel de significancia alfa.

Si el valor p es menor o igual que alfa, entonces rechazamos la hipótesis nula. Esto significa que tenemos un resultado estadísticamente significativo y que vamos a aceptar la hipótesis alternativa.
Si el valor p es mayor que alfa, no podemos rechazar la hipótesis nula. Esto no prueba que la hipótesis nula sea cierta. En cambio, significa que no obtuvimos suficiente evidencia convincente para rechazar la hipótesis nula.

Nota especial

los intervalo de confianza para la diferencia de dos proporciones de población no agrupa los éxitos, mientras que la prueba de hipótesis sí. La razón de esto es que nuestra hipótesis nula supone que pag₁ - pag₂= 0. El intervalo de confianza no asume esto. Algunos estadísticos no agrupan los éxitos para esta prueba de hipótesis, y en su lugar utilizan una versión ligeramente modificada de la estadística de prueba anterior.