El termino curva de campana se utiliza para describir el concepto matemático llamado distribución normal, a veces denominado distribución gaussiana. La "curva de campana" se refiere a la forma de campana que se crea cuando se traza una línea utilizando los puntos de datos para un elemento que cumple con los criterios de distribución normal.
En una curva de campana, el centro contiene el mayor número de un valor y, por lo tanto, es el punto más alto en el arco de la línea. Este punto se refiere a la media, pero en términos simples, es el mayor número de ocurrencias de un elemento (en términos estadísticos, el modo).
Distribución normal
Lo importante a tener en cuenta sobre un distribución normal es que la curva se concentra en el centro y disminuye a cada lado. Esto es significativo porque los datos tienen menos tendencia a producir valores inusualmente extremos, llamados valores atípicos, en comparación con otras distribuciones. Además, la curva de campana significa que los datos son simétricos. Esto significa que puede crear expectativas razonables en cuanto a la posibilidad de que un resultado se encuentre dentro de un rango a la izquierda o derecha del centro, una vez que haya medido la cantidad de desviación contenida en los datos. Esto se mide en términos de
desviaciones estandar.Un gráfico de curva de campana depende de dos factores: la media y la desviación estándar. La media identifica la posición del centro y la desviación estándar determina la altura y el ancho de la campana. Por ejemplo, una gran desviación estándar crea una campana que es corta y ancha, mientras que una pequeña desviación estándar crea una curva alta y estrecha.
Probabilidad de curva de campana y desviación estándar
Para comprender los factores de probabilidad de una distribución normal, debe comprender las siguientes reglas:
- El área total debajo de la curva es igual a 1 (100%)
- Alrededor del 68% del área bajo la curva cae dentro de una desviación estándar.
- Alrededor del 95% del área bajo la curva cae dentro de dos desviaciones estándar.
- Alrededor del 99.7% del área bajo la curva cae dentro de tres desviaciones estándar.
Los ítems 2, 3 y 4 anteriores a veces se denominan la regla empírica o la regla 68-95-99.7. Una vez que determine que los datos se distribuyen normalmente (campana curvada) y calcular la media y Desviación Estándar, puedes determinar el probabilidad que un único punto de datos caerá dentro de un rango dado de posibilidades.
Ejemplo de curva de campana
Un buen ejemplo de una curva de campana o distribución normal es la tirar dos dados. La distribución se centra alrededor del número siete y la probabilidad disminuye a medida que te alejas del centro.
Aquí está el porcentaje de posibilidades de varios resultados cuando lanzas dos dados.
- Dos: (1/36) 2.78%
- Tres: (2/36) 5.56%
- Cuatro: (3/36) 8.33%
- Cinco: (4/36) 11.11%
- Seis: (5/36) 13.89%
- Siete: (6/36) 16.67% = resultado más probable
- Ocho: (5/36) 13.89%
- Nueve: (4/36) 11.11%
- Diez: (3/36) 8.33%
- Once: (2/36) 5.56%
- Doce: (1/36) 2.78%
Las distribuciones normales tienen muchas propiedades convenientes, por lo que en muchos casos, especialmente en física y astronomía, las variaciones aleatorias con distribuciones desconocidas a menudo se supone que son normales para permitir cálculos de probabilidad. Aunque esto puede ser una suposición peligrosa, a menudo es una buena aproximación debido a un resultado sorprendente conocido como teorema del límite central.
Este teorema establece que la media de cualquier conjunto de variantes con cualquier distribución que tenga una media y una varianza finitas tiende a ocurrir en una distribución normal. Muchos atributos comunes, como los puntajes de las pruebas o la altura, siguen distribuciones más o menos normales, con pocos miembros en los extremos alto y bajo y muchos en el medio.
Cuando no deberías usar la curva de campana
Hay algunos tipos de datos que no siguen un patrón de distribución normal. Estos conjuntos de datos no deberían verse obligados a intentar ajustar una curva de campana. Un ejemplo clásico serían las calificaciones de los estudiantes, que a menudo tienen dos modos. Otros tipos de datos que no siguen la curva incluyen ingresos, crecimiento de la población y fallas mecánicas.