Los datos emparejados en las estadísticas, a menudo denominados pares ordenados, se refieren a dos variables en los individuos de una población que están vinculadas entre sí para determinar la correlación entre ellas. Para que un conjunto de datos se considere datos emparejados, ambos valores de datos deben adjuntarse o vincularse entre sí y no considerarse por separado.
La idea de datos emparejados contrasta con la asociación habitual de un número a cada punto de datos como en otro datos cuantitativos establece que cada punto de datos individual está asociado con dos números, proporcionando un gráfico que permite a los estadísticos observar la relación entre estas variables en una población.
Este método de datos emparejados se usa cuando un estudio espera comparar dos variables en individuos de la población para sacar algún tipo de conclusión sobre la correlación observada. Al observar estos puntos de datos, el orden del emparejamiento es importante porque el primer número es una medida de una cosa, mientras que el segundo es una medida de algo completamente diferente.
Ejemplo de datos emparejados
Para ver un ejemplo de datos emparejados, suponga que un maestro cuenta el número de tareas asignadas a cada alumno entregado para una unidad en particular y luego empareja este número con el porcentaje de cada estudiante en la prueba de la unidad. Los pares son los siguientes:
- Una persona que completó 10 tareas obtuvo el 95% en su examen. (10, 95%)
- Una persona que completó 5 tareas obtuvo el 80% en su examen. (5, 80%)
- Una persona que completó 9 tareas obtuvo el 85% en su examen. (9, 85%)
- Una persona que completó 2 tareas obtuvo el 50% en su examen. (2, 50%)
- Una persona que completó 5 tareas obtuvo el 60% en su examen. (5, 60%)
- Una persona que completó 3 tareas obtuvo el 70% en su examen. (3, 70%)
En cada uno de estos conjuntos de datos emparejados, podemos ver que el número de asignaciones siempre viene primero en el par ordenado, mientras que el porcentaje obtenido en la prueba ocupa el segundo lugar, como se ve en la primera instancia de (10, 95%).
Si bien un análisis estadístico de estos datos también podría usarse para calcular el número promedio de tareas completadas o el puntaje promedio de la prueba, puede haber otras preguntas para hacer los datos. En este caso, el maestro quiere saber si hay alguna conexión entre el número de tareas asignadas entregado y rendimiento en la prueba, y el maestro necesitaría mantener los datos emparejados para responder esto pregunta.
Analizando datos emparejados
los técnicas estadísticas de correlación y regresión se utilizan para analizar datos emparejados en los que el coeficiente de correlación cuantifica qué tan cerca se encuentran los datos a lo largo de una línea recta y mide la fuerza de la relación lineal.
La regresión, por otro lado, se utiliza para varias aplicaciones, incluida la determinación de qué línea se ajusta mejor a nuestro conjunto de datos. Esta línea puede, a su vez, usarse para estimar o predecir y valores para valores de X que no formaban parte de nuestro conjunto de datos original.
Hay un tipo especial de gráfico que es especialmente adecuado para datos emparejados llamado diagrama de dispersión. En esto tipo de gráfico, un eje de coordenadas representa una cantidad de datos emparejados, mientras que el otro eje de coordenadas representa la otra cantidad de datos emparejados.
Un diagrama de dispersión para los datos anteriores haría que el eje x indicara el número de asignaciones entregadas, mientras que el eje y denotaría los puntajes en la prueba unitaria.