La varianza y la desviación estándar son dos medidas de variación estrechamente relacionadas de las que escuchará mucho en estudios, revistas o clases de estadísticas. Son dos conceptos básicos y fundamentales en estadística que deben entenderse para comprender la mayoría de los demás conceptos o procedimientos estadísticos. A continuación, revisaremos cuáles son y cómo encontrar la varianza y la desviación estándar.
Conclusiones clave: varianza y desviación estándar
- La varianza y la desviación estándar nos muestran cuánto varían los puntajes en una distribución del promedio.
- La desviación estándar es la raíz cuadrada de la varianza.
- Para conjuntos de datos pequeños, la varianza se puede calcular a mano, pero los programas estadísticos se pueden utilizar para conjuntos de datos más grandes.
Definición
Por definición, la varianza y la desviación estándar son medidas de variación para variables de relación de intervalo. Describen cuánta variación o diversidad hay en una distribución. Ambos varianza y desviación estándar
aumentar o disminuir en función de qué tan cerca se agrupan los puntajes alrededor de la media.La varianza se define como el promedio de las desviaciones al cuadrado de la media. Para calcular la varianza, primero resta la media de cada número y luego eleva al cuadrado los resultados para encontrar las diferencias al cuadrado. Luego encuentras el promedio de esas diferencias al cuadrado. El resultado es la varianza.
La desviación estándar es una medida de la distribución de los números en una distribución. Indica cuánto, en promedio, cada uno de los valores en la distribución se desvía de la media o centro de la distribución. Se calcula tomando la raíz cuadrada de la varianza.
Un ejemplo conceptual
La varianza y la desviación estándar son importantes porque nos dicen cosas sobre el conjunto de datos que no podemos aprender con solo mirar el media o promedio. Como ejemplo, imagine que tiene tres hermanos menores: un hermano que tiene 13 años y gemelos que tienen 10. En este caso, la edad promedio de sus hermanos sería de 11 años. Ahora imagine que tiene tres hermanos, de 17, 12 y 4 años. En este caso, la edad promedio de sus hermanos aún sería de 11 años, pero la varianza y la desviación estándar serían mayores.
Un ejemplo cuantitativo
Supongamos que queremos encontrar la varianza y la desviación estándar de la edad entre su grupo de 5 amigos cercanos. Las edades de usted y sus amigos son 25, 26, 27, 30 y 32.
Primero, debemos encontrar la edad media: (25 + 26 + 27 + 30 + 32) / 5 = 28.
Luego, necesitamos calcular las diferencias de la media para cada uno de los 5 amigos.
25 – 28 = -3
26 – 28 = -2
27 – 28 = -1
30 – 28 = 2
32 – 28 = 4
Luego, para calcular la varianza, tomamos cada diferencia de la media, la elevamos al cuadrado y luego promediamos el resultado.
Varianza = ((-3)2 + (-2)2 + (-1)2 + 22 + 42)/ 5
= (9 + 4 + 1 + 4 + 16 ) / 5 = 6.8
Entonces, la varianza es 6.8. Y la desviación estándar es la raíz cuadrada de la varianza, que es 2.61. Lo que esto significa es que, en promedio, usted y sus amigos tienen una edad de 2.61 años.
Aunque es posible calcular la varianza a mano para conjuntos de datos más pequeños como este, programas de software estadístico También se puede utilizar para calcular la varianza y la desviación estándar.
Muestra versus población
Al realizar pruebas estadísticas, es importante tener en cuenta la diferencia entre un población y un muestra. Para calcular la desviación estándar (o varianza) de una población, deberá recopilar mediciones para todos los miembros del grupo que está estudiando; para una muestra, solo recolectaría mediciones de un subconjunto de la población.
En el ejemplo anterior, asumimos que el grupo de cinco amigos era una población; si lo hubiéramos tratado como una muestra, calcular la desviación estándar de la muestra y la varianza de la muestra sería ligeramente diferente (en lugar de dividir por el tamaño de la muestra para encontrar el varianza, habríamos restado primero uno del tamaño de la muestra y luego dividido por este más pequeño número).
Importancia de la varianza y la desviación estándar
La varianza y la desviación estándar son importantes en las estadísticas, ya que sirven como base para otros tipos de cálculos estadísticos. Por ejemplo, la desviación estándar es necesaria para convertir los puntajes de las pruebas en Puntuaciones Z. La varianza y la desviación estándar también juegan un papel importante al realizar pruebas estadísticas como pruebas t.
Referencias
Frankfort-Nachmias, C. & Leon-Guerrero, A. (2006). Estadísticas sociales para una sociedad diversa. Thousand Oaks, CA: Pine Forge Press.