¿Qué es la robustez en las estadísticas?

En Estadísticas, el término robusto o robustez se refiere a la solidez de un modelo estadístico, pruebas y procedimientos de acuerdo con las condiciones específicas del análisis estadístico que un estudio espera lograr. Dado que se cumplen estas condiciones de un estudio, se puede verificar que los modelos son verdaderos mediante el uso de pruebas matemáticas.

Muchos modelos se basan en situaciones ideales que no existen cuando se trabaja con datos del mundo real y, como resultado, el modelo puede proporcionar resultados correctos incluso si las condiciones no se cumplen exactamente.

Las estadísticas sólidas, por lo tanto, son estadísticas que producen un buen rendimiento cuando los datos se extraen de una amplia gama de distribuciones de probabilidad que no se ven afectadas en gran medida por valores atípicos o pequeñas desviaciones de los supuestos del modelo en un determinado conjunto de datos En otras palabras, una estadística robusta es resistente a los errores en los resultados.

Una forma de observar un procedimiento estadístico robusto comúnmente sostenido, es que no se debe buscar más allá de los procedimientos t, que utilizan pruebas de hipótesis para determinar las predicciones estadísticas más precisas.

instagram viewer

Observación de procedimientos en T

Para un ejemplo de robustez, consideraremos t-procedimientos, que incluyen el intervalo de confianza para una media poblacional con desviación estándar poblacional desconocida, así como pruebas de hipótesis sobre la media poblacional.

El uso de t-Los procedimientos asumen lo siguiente:

El conjunto de datos con el que estamos trabajando es un muestra aleatoria simple de la población.
La población de la que hemos tomado muestras está normalmente distribuida.

En la práctica, con ejemplos de la vida real, los estadísticos rara vez tienen una población que se distribuye normalmente, por lo que la pregunta es: "¿Cuán robustos son nuestros t-procedimientos?

En general, la condición de que tengamos una muestra aleatoria simple es más importante que la condición que hemos muestreado de una población normalmente distribuida; La razón de esto es que el teorema del límite central asegura una distribución de muestreo que es aproximadamente normal: cuanto mayor sea el tamaño de nuestra muestra, más cercana será la distribución muestral de la media muestral normal.

Cómo funcionan los procedimientos T como estadísticas robustas

Tan robustez para t-procedimientos depende del tamaño de la muestra y la distribución de nuestra muestra. Las consideraciones para esto incluyen:

Si el tamaño de las muestras es grande, lo que significa que tenemos 40 o más observaciones, entonces t-los procedimientos se pueden usar incluso con distribuciones sesgadas.
Si el tamaño de la muestra está entre 15 y 40, entonces podemos usar t-procedimientos para cualquier distribución conformada, a menos que haya valores atípicos o un alto grado de asimetría.
Si el tamaño de la muestra es inferior a 15, entonces podemos usar t- procedimientos para datos que no tienen valores atípicos, un solo pico y son casi simétricos.

En la mayoría de los casos, la solidez se ha establecido a través del trabajo técnico en estadística matemática y, Afortunadamente, no necesariamente tenemos que hacer estos cálculos matemáticos avanzados para poder utilizarlos; solo necesitamos entender cuáles son las pautas generales para la solidez de nuestro método estadístico específico.

Los procedimientos T funcionan como estadísticas robustas, ya que generalmente producen un buen rendimiento según estos modelos al tener en cuenta el tamaño de la muestra en la base para aplicar el procedimiento.