Ejemplo de dos muestras de prueba T e intervalo de confianza

A veces, en las estadísticas, es útil ver ejemplos resueltos de problemas. Estos ejemplos pueden ayudarnos a resolver problemas similares. En este artículo, analizaremos el proceso de llevar a cabo estadísticas inferenciales para obtener un resultado relativo a dos medios de población. No solo veremos cómo llevar a cabo una prueba de hipotesis sobre la diferencia de dos medias de población, también construiremos un intervalo de confianza por esta diferencia Los métodos que utilizamos a veces se denominan prueba t de dos muestras y un intervalo de confianza t de dos muestras.

La declaración del problema

Supongamos que deseamos evaluar la aptitud matemática de los niños de primaria. Una pregunta que podemos tener es si los niveles de grado más altos tienen puntajes de prueba promedio más altos.

Una muestra aleatoria simple de 27 estudiantes de tercer grado recibe una prueba de matemáticas, se califican sus respuestas y se encuentra que los resultados tienen una puntuación media de 75 puntos con un muestra desviación estándar de 3 puntos.

instagram viewer

Una muestra aleatoria simple de 20 estudiantes de quinto grado recibe el mismo examen de matemáticas y sus respuestas se califican. El puntaje promedio para los estudiantes de quinto grado es 84 puntos con una desviación estándar de muestra de 5 puntos.

Ante este escenario hacemos las siguientes preguntas:

  • ¿Los datos de la muestra nos proporcionan evidencia de que la puntuación media de la prueba de la población de todos los alumnos de quinto grado excede la puntuación media de la población de todos los alumnos de tercer grado?
  • ¿Cuál es un intervalo de confianza del 95% para la diferencia en las puntuaciones medias de las pruebas entre las poblaciones de alumnos de tercer y quinto grado?

Condiciones y procedimiento

Debemos seleccionar qué procedimiento usar. Al hacer esto, debemos asegurarnos y verificar que se hayan cumplido las condiciones para este procedimiento. Se nos pide que comparemos dos medias poblacionales. Una colección de métodos que se pueden utilizar para hacer esto son los de los procedimientos t de dos muestras.

Para utilizar estos procedimientos t para dos muestras, debemos asegurarnos de que se cumplan las siguientes condiciones:

  • Tenemos dos muestras aleatorias simples de las dos poblaciones de interés.
  • Nuestras muestras aleatorias simples no constituyen más del 5% de la población.
  • Las dos muestras son independientes entre sí, y no hay coincidencia entre los sujetos.
  • La variable se distribuye normalmente.
  • Tanto la media poblacional como la desviación estándar son desconocidas para ambas poblaciones.

Vemos que la mayoría de estas condiciones se cumplen. Nos dijeron que tenemos muestras aleatorias simples. Las poblaciones que estamos estudiando son grandes, ya que hay millones de estudiantes en estos niveles de grado.

La condición que no podemos asumir automáticamente es si los puntajes de las pruebas se distribuyen normalmente. Dado que tenemos un tamaño de muestra lo suficientemente grande, por la solidez de nuestros procedimientos t, no necesariamente necesitamos que la variable esté distribuida normalmente.

Como se cumplen las condiciones, realizamos un par de cálculos preliminares.

Error estándar

El error estándar es una estimación de una desviación estándar. Para esta estadística, agregamos la varianza muestral de las muestras y luego tomamos la raíz cuadrada. Esto da la fórmula:

(s1 2 / norte1 + s22 / norte2)1/2

Al usar los valores anteriores, vemos que el valor del error estándar es

(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583

Grados de libertad

Podemos usar la aproximación conservadora para nuestro grados de libertad. Esto puede subestimar el número de grados de libertad, pero es mucho más fácil de calcular que usar la fórmula de Welch. Usamos el menor de los dos tamaños de muestra, y luego restamos uno de este número.

Para nuestro ejemplo, la menor de las dos muestras es 20. Esto significa que el número de grados de libertad es 20 - 1 = 19.

Prueba de hipotesis

Deseamos probar la hipótesis de que los estudiantes de quinto grado tienen un puntaje promedio en la prueba que es mayor que el puntaje promedio de los estudiantes de tercer grado. Deje μ1 ser la puntuación media de la población de todos los alumnos de quinto grado. Del mismo modo, dejamos μ2 ser la puntuación media de la población de todos los alumnos de tercer grado.

Las hipótesis son las siguientes:

  • H0: μ1 - μ2 = 0
  • Hun: μ1 - μ2 > 0

El estadístico de prueba es la diferencia entre las medias de muestra, que luego se divide por el error estándar. Dado que estamos utilizando desviaciones estándar de muestra para estimar la desviación estándar de la población, el estadístico de prueba de la distribución t.

El valor del estadístico de prueba es (84-75) /1.2583. Esto es aproximadamente 7.15.

Ahora determinamos cuál es el valor p para esta prueba de hipótesis. Observamos el valor del estadístico de prueba y su ubicación en una distribución t con 19 grados de libertad. Para esta distribución, tenemos 4.2 x 10-7 como nuestro valor p (Una forma de determinar esto es usar la función T.DIST.RT en Excel).

Como tenemos un valor p tan pequeño, rechazamos la hipótesis nula. La conclusión es que el puntaje promedio de la prueba para los estudiantes de quinto grado es más alto que el puntaje promedio de la prueba para los estudiantes de tercer grado.

Intervalo de confianza

Como hemos establecido que existe una diferencia entre las puntuaciones medias, ahora determinamos un intervalo de confianza para la diferencia entre estas dos medias. Ya tenemos mucho de lo que necesitamos. El intervalo de confianza para la diferencia debe tener una estimación y un margen de error.

La estimación de la diferencia de dos medias es fácil de calcular. Simplemente encontramos la diferencia de las medias muestrales. Esta diferencia de las medias muestrales estima la diferencia de las medias poblacionales.

Para nuestros datos, la diferencia en las medias muestrales es 84-75 = 9.

El margen de error es un poco más difícil de calcular. Para esto, necesitamos multiplicar la estadística apropiada por el error estándar. La estadística que necesitamos se encuentra consultando una tabla o software estadístico.

Una vez más, utilizando la aproximación conservadora, tenemos 19 grados de libertad. Para un intervalo de confianza del 95%, vemos que t* = 2.09. Podríamos usar el Función T.INV en Excel para calcular este valor.

Ahora ponemos todo junto y vemos que nuestro margen de error es 2.09 x 1.2583, que es aproximadamente 2.63. El intervalo de confianza es 9 ± 2.63. El intervalo es de 6.37 a 11.63 puntos en la prueba que eligieron los alumnos de quinto y tercer grado.

instagram story viewer