Una pregunta que siempre es importante hacer en Estadísticas es, "¿El resultado observado se debe solo al azar o es Estadísticamente significante? Una clase de pruebas de hipótesis, llamadas pruebas de permutación, nos permiten probar esta pregunta. La descripción general y los pasos de dicha prueba son:
- Dividimos a nuestros sujetos en un control y un grupo experimental. La hipótesis nula es que no hay diferencia entre estos dos grupos.
- Aplicar un tratamiento al grupo experimental.
- Medir la respuesta al tratamiento.
- Considere todas las configuraciones posibles del grupo experimental y la respuesta observada.
- Calcule un valor p basado en nuestra respuesta observada en relación con todos los grupos experimentales potenciales.
Este es un resumen de una permutación. De acuerdo con este esquema, pasaremos el tiempo mirando un ejemplo resuelto de tal prueba de permutación con gran detalle.
Ejemplo
Supongamos que estamos estudiando ratones. En particular, estamos interesados en la rapidez con que los ratones terminan un laberinto que nunca antes habían encontrado. Deseamos proporcionar evidencia a favor de un tratamiento experimental. El objetivo es demostrar que los ratones del grupo de tratamiento resolverán el laberinto más rápidamente que los ratones no tratados.
Comenzamos con nuestros sujetos: seis ratones. Por conveniencia, se hará referencia a los ratones con las letras A, B, C, D, E, F. Tres de estos ratones deben seleccionarse al azar para el tratamiento experimental, y los otros tres se colocan en un grupo de control en el que los sujetos reciben un placebo.
A continuación, elegiremos al azar el orden en que se seleccionan los ratones para ejecutar el laberinto. Se anotará el tiempo dedicado a terminar el laberinto para todos los ratones y se calculará una media de cada grupo.
Supongamos que nuestra selección aleatoria tiene los ratones A, C y E en el grupo experimental, con los otros ratones en el placebo grupo de control. Una vez que se ha implementado el tratamiento, elegimos al azar el orden para que los ratones corran por el laberinto.
Los tiempos de ejecución para cada uno de los ratones son:
- El mouse A corre la carrera en 10 segundos
- El mouse B corre la carrera en 12 segundos
- Mouse C corre la carrera en 9 segundos
- Mouse D corre la carrera en 11 segundos
- Mouse E corre la carrera en 11 segundos
- Mouse F corre la carrera en 13 segundos.
El tiempo promedio para completar el laberinto para los ratones en el grupo experimental es de 10 segundos. El tiempo promedio para completar el laberinto para aquellos en el grupo de control es de 12 segundos.
Podríamos hacer un par de preguntas. ¿Es realmente el tratamiento la razón del tiempo promedio más rápido? ¿O tuvimos suerte en nuestra selección de control y grupo experimental? El tratamiento puede no haber tenido efecto y elegimos al azar los ratones más lentos para recibir el placebo y los ratones más rápidos para recibir el tratamiento. Una prueba de permutación ayudará a responder estas preguntas.
Hipótesis
Las hipótesis para nuestra prueba de permutación son:
- los hipótesis nula es la declaración de no tener efecto. Para esta prueba específica, tenemos H0: No hay diferencia entre los grupos de tratamiento. El tiempo medio para ejecutar el laberinto para todos los ratones sin tratamiento es el mismo que para todos los ratones con el tratamiento.
- La hipótesis alternativa es de lo que estamos tratando de establecer evidencia a favor. En este caso, tendríamos Hun: El tiempo promedio para todos los ratones con el tratamiento será más rápido que el tiempo promedio para todos los ratones sin el tratamiento.
Permutaciones
Hay seis ratones, y hay tres lugares en el grupo experimental. Esto significa que el número de posibles grupos experimentales viene dado por el número de combinaciones C (6,3) = 6! / (3! 3!) = 20. Los individuos restantes serían parte del grupo de control. Por lo tanto, hay 20 formas diferentes de elegir al azar individuos en nuestros dos grupos.
La asignación de A, C y E al grupo experimental se realizó al azar. Como hay 20 configuraciones de este tipo, la específica con A, C y E en el grupo experimental tiene una probabilidad de 1/20 = 5% de ocurrir.
Necesitamos determinar las 20 configuraciones del grupo experimental de los individuos en nuestro estudio.
- Grupo experimental: A B C y grupo de control: D E F
- Grupo experimental: A B D y grupo de control: C E F
- Grupo experimental: A B E y grupo de control: C D F
- Grupo experimental: A B F y grupo de control: C D E
- Grupo experimental: A C D y grupo de control: B E F
- Grupo experimental: A C E y grupo de control: B D F
- Grupo experimental: A C F y grupo de control: B D E
- Grupo experimental: A D E y grupo de control: B C F
- Grupo experimental: A D F y grupo de control: B C E
- Grupo experimental: A E F y grupo de control: B C D
- Grupo experimental: B C D y grupo de control: A E F
- Grupo experimental: B C E y grupo de control: A D F
- Grupo experimental: B C F y grupo de control: A D E
- Grupo experimental: B D E y grupo de control: A C F
- Grupo experimental: B D F y grupo de control: A C E
- Grupo experimental: B E F y grupo de control: A C D
- Grupo experimental: C D E y grupo de control: A B F
- Grupo experimental: C D F y grupo de control: A B E
- Grupo experimental: C E F y grupo de control: A B D
- Grupo experimental: D E F y grupo de control: A B C
Luego observamos cada configuración de grupos experimentales y de control. Calculamos la media para cada una de las 20 permutaciones en la lista anterior. Por ejemplo, para el primero, A, B y C tienen tiempos de 10, 12 y 9, respectivamente. La media de estos tres números es 10.3333. También en esta primera permutación, D, E y F tienen tiempos de 11, 11 y 13, respectivamente. Esto tiene un promedio de 11.6666.
Después de calcular el media de cada grupo, calculamos la diferencia entre estas medias. Cada uno de los siguientes corresponde a la diferencia entre los grupos experimentales y de control que se enumeraron anteriormente.
- Placebo - Tratamiento = 1.333333333 segundos
- Placebo - Tratamiento = 0 segundos
- Placebo - Tratamiento = 0 segundos
- Placebo - Tratamiento = -1.333333333 segundos
- Placebo - Tratamiento = 2 segundos
- Placebo - Tratamiento = 2 segundos
- Placebo - Tratamiento = 0.666666667 segundos
- Placebo - Tratamiento = 0.666666667 segundos
- Placebo - Tratamiento = -0.666666667 segundos
- Placebo - Tratamiento = -0.666666667 segundos
- Placebo - Tratamiento = 0.666666667 segundos
- Placebo - Tratamiento = 0.666666667 segundos
- Placebo - Tratamiento = -0.666666667 segundos
- Placebo - Tratamiento = -0.666666667 segundos
- Placebo - Tratamiento = -2 segundos
- Placebo - Tratamiento = -2 segundos
- Placebo - Tratamiento = 1.333333333 segundos
- Placebo - Tratamiento = 0 segundos
- Placebo - Tratamiento = 0 segundos
- Placebo - Tratamiento = -1.333333333 segundos
Valor p
Ahora clasificamos las diferencias entre las medias de cada grupo que notamos anteriormente. También tabulamos el porcentaje de nuestras 20 configuraciones diferentes que están representadas por cada diferencia de medias. Por ejemplo, cuatro de los 20 no tuvieron diferencias entre las medias de los grupos de control y tratamiento. Esto representa el 20% de las 20 configuraciones mencionadas anteriormente.
- -2 por 10%
- -1,33 por 10%
- -0.667 por 20%
- 0 por 20%
- 0.667 por 20%
- 1,33 por 10%
- 2 por 10%.
Aquí comparamos este listado con nuestro resultado observado. Nuestra selección aleatoria de ratones para los grupos de tratamiento y control resultó en una diferencia promedio de 2 segundos. También vemos que esta diferencia corresponde al 10% de todas las muestras posibles. El resultado es que para este estudio tenemos un valor p del 10%