¿Qué son los residuos?

La regresión lineal es una herramienta estadística que determina qué tan bien se ajusta una línea recta a un conjunto de datos emparejados. La línea recta que mejor se ajusta a esos datos se llama la línea de regresión de mínimos cuadrados. Esta línea se puede usar de varias maneras. Uno de estos usos es estimar el valor de una variable de respuesta para un valor dado de una variable explicativa. Relacionado con esta idea está la de un residuo.

(1, 2), (2, 3), (3, 7), (3, 6), (4, 9), (5, 9)

Para calcular el residual en los puntos X = 5, restamos el valor predicho de nuestro valor observado. Desde el y La coordenada de nuestro punto de datos fue 9, esto da un residuo de 9-10 = -1.

Hay varios usos para los residuos. Un uso es ayudarnos a determinar si tenemos un conjunto de datos que tiene una tendencia lineal general, o si deberíamos considerar un modelo diferente. La razón de esto es que los residuos ayudan a amplificar cualquier patrón no lineal en nuestros datos. Lo que puede ser difícil de ver al observar un diagrama de dispersión se puede observar más fácilmente al examinar los residuos y un gráfico de residuos correspondiente.

instagram viewer

Otra razón para considerar los residuos es verificar que se cumplen las condiciones de inferencia para la regresión lineal. Después de la verificación de una tendencia lineal (verificando los residuos), también verificamos la distribución de los residuos. Para poder realizar una inferencia de regresión, queremos que los residuos alrededor de nuestra línea de regresión se distribuyan aproximadamente de manera normal. UN histograma o stemplot de los residuos ayudará a verificar que se haya cumplido esta condición.

instagram story viewer