4.9 Distribución normal

La estatura de las personas adultas, los errores de medida de un instrumento, las puntuaciones de un examen tipificado o el peso de los paquetes de azúcar de una marca tienen algo en común: si dibujas un histograma con muchísimos datos, aparece siempre la misma silueta, una campana con un pico central y dos colas que descienden de forma simétrica. Esa silueta es tan habitual en la naturaleza y en las medidas que la distribución que la describe se llama, sin más, normal.

El subtema NM 4.9 da el salto de las variables discretas (4.7 y 4.8) a las variables continuas. Aquí aprenderás a reconocer la distribución normal por su forma y sus propiedades, a estimar probabilidades a ojo con la regla empírica 68-95-99,7, a calcular probabilidades exactas con la calculadora gráfica y a recorrer el camino inverso: partir de una probabilidad para encontrar el valor de la variable. Es el modelo continuo central de la asignatura y el cimiento del subtema siguiente, la tipificación con valores z.

La curva normal y sus propiedades

Forma de campana y parámetros

Una variable aleatoria continua X sigue una distribución normal cuando su gráfica de probabilidad es la conocida curva en forma de campana. La distribución queda completamente determinada por dos números, sus parámetros: la media μ y la desviación típica σ. Se escribe X ~ N(μ, σ²), donde el segundo parámetro es la varianza σ².

  Propiedades de la curva normal
  Tiene forma de campana: un único máximo central y descenso suave hacia los dos lados.
Es simétrica respecto de la media μ. El eje de simetría pasa por μ, que es a la vez la media, la mediana y la moda de la distribución.
El área total bajo la curva vale 1, porque representa la probabilidad de todos los resultados posibles. El área a la izquierda de μ y la de la derecha valen 0,5 cada una.
Las colas se acercan al eje horizontal pero no lo tocan: en teoría la variable puede tomar valores arbitrariamente grandes o pequeños, aunque con probabilidad cada vez más baja.
μ controla la posición de la campana (la traslada a izquierda o derecha) y σ controla su anchura (σ pequeña → campana estrecha y alta; σ grande → campana ancha y baja).

Conviene tener presente una diferencia esencial con las variables discretas. En una variable continua, la probabilidad de que X tome exactamente un valor concreto es cero: tiene sentido preguntar por la probabilidad de un intervalo, como P(X < 70) o P(60 < X < 80), pero no por la de un punto aislado. Esa probabilidad es el área bajo la curva sobre el intervalo. Una consecuencia práctica útil: como los puntos no aportan área, P(X < a) y P(X ≤ a) valen exactamente lo mismo en una distribución normal.

💡 Dibuja siempre la campana: en cualquier problema de distribución normal, esboza la curva, marca la media en el centro y sombrea la región cuya probabilidad buscas. El dibujo te dice de un vistazo si el resultado debe ser mayor o menor que 0,5 y te evita errores de signo y de complementario. Es el hábito más rentable de todo el subtema.

La regla empírica 68-95-99,7

Aunque la forma exacta de la campana depende de μ y σ, todas las distribuciones normales reparten su probabilidad de la misma manera respecto de la media, medida en unidades de σ. Ese reparto es la regla empírica, también llamada regla 68-95-99,7.

Regla empírica (68-95-99,7)

En cualquier distribución normal de media μ y desviación típica σ:

Aproximadamente el 68 % de los datos cae en el intervalo μ − σ a μ + σ.
Aproximadamente el 95 % de los datos cae en el intervalo μ − 2σ a μ + 2σ.
Aproximadamente el 99,7 % de los datos cae en el intervalo μ − 3σ a μ + 3σ.

Como la curva es simétrica, cada intervalo se reparte a partes iguales a los dos lados de μ. Por ejemplo, el 68 % central deja un 32 % en las dos colas, es decir, un 16 % en cada cola.

Ejemplo 1 — estimar una probabilidad con la regla empírica. El tiempo que tarda un autobús urbano en cubrir cierta línea sigue una distribución normal de media μ = 24 minutos y desviación típica σ = 3 minutos. Estima el porcentaje de trayectos que duran entre 18 y 30 minutos.

Expresar los límites del intervalo en función de μ y σ. Límite inferior: 18 = 24 − 6 = 24 − 2·3 = μ − 2σ.
Límite superior: 30 = 24 + 6 = 24 + 2·3 = μ + 2σ.
El intervalo pedido es exactamente μ − 2σ a μ + 2σ; por la regla empírica abarca el 95 % de los datos.
Conclusión: alrededor del 95 % de los trayectos duran entre 18 y 30 minutos.

Ejemplo 2 — usar la simetría de la regla. Con la misma distribución del autobús (μ = 24, σ = 3), estima la probabilidad de que un trayecto dure más de 27 minutos.

Reconocer el valor: 27 = 24 + 3 = μ + σ.
El intervalo μ − σ a μ + σ contiene el 68 % de los datos; fuera de él queda el 100 − 68 = 32 %.
Por simetría, ese 32 % se reparte a partes iguales: 16 % por debajo de μ − σ y 16 % por encima de μ + σ.
«Más de 27 minutos» es la cola por encima de μ + σ, luego P(X > 27) ≈ 0,16, es decir, un 16 %.

Error frecuente

Aplicar la regla empírica a intervalos que no son exactamente μ ± σ, μ ± 2σ o μ ± 3σ. La regla 68-95-99,7 solo da esos tres porcentajes; no sirve, por ejemplo, para estimar P(X < 25,5) en el caso del autobús, porque 25,5 no es un múltiplo entero de σ por encima de μ. Para intervalos cualesquiera hay que usar la calculadora gráfica. La regla empírica es una herramienta de estimación rápida para casos «redondos», no un sustituto de la calculadora.

Cálculo de probabilidades con tecnología

Probabilidades de un intervalo cualquiera

Para intervalos que no encajan con la regla empírica, el examen del IB espera que uses la calculadora gráfica. Las calculadoras admitidas tienen una función de probabilidad normal (en la TI se llama normalcdf) que pide el límite inferior, el límite superior, la media μ y la desviación típica σ, y devuelve el área bajo la campana entre esos límites, es decir, la probabilidad del intervalo.

Para colas abiertas se usa un límite muy grande o muy pequeño. Para P(X > a) se toma como límite superior un valor enorme (en la práctica, algo como 10⁹⁹ o un número claramente mayor que cualquier dato posible); para P(X < a), un límite inferior muy negativo. Y recuerda que para una variable normal P(X < a) = P(X ≤ a).

Ejemplo 3 — probabilidad de un intervalo con calculadora. La masa de los paquetes de café de una marca sigue una distribución normal de media μ = 250 g y desviación típica σ = 4 g. Calcula (a) la probabilidad de que un paquete pese menos de 245 g y (b) la probabilidad de que pese entre 248 y 256 g.

El modelo es X ~ N(250, 4²). Esbozar la campana centrada en 250.
(a) P(X < 245): cola izquierda. Con la calculadora, límite inferior muy negativo, superior 245, μ = 250, σ = 4. Da P(X < 245) ≈ 0,106 (3 cifras significativas). Coherente: 245 está por debajo de la media, así que la probabilidad es menor que 0,5.
(b) P(248 < X < 256): intervalo cerrado. Con la calculadora, límite inferior 248, superior 256, μ = 250, σ = 4. Da P(248 < X < 256) ≈ 0,624 (3 cifras significativas).
Lectura: algo más del 62 % de los paquetes pesan entre 248 g y 256 g.

El proceso inverso: de la probabilidad al valor

Hasta aquí hemos partido de un valor de la variable para hallar una probabilidad. El proceso inverso recorre el camino al revés: se conoce una probabilidad y se busca el valor de X que la produce. En este subtema, μ y σ son datos conocidos; solo se desconoce el valor de la variable.

La calculadora gráfica tiene para esto la función normal inversa (en la TI, invNorm), que pide una probabilidad acumulada por la izquierda, la media μ y la desviación típica σ, y devuelve el valor a tal que P(X < a) es esa probabilidad. La clave es siempre traducir la pregunta a una probabilidad «por la izquierda» antes de usar la función.

💡 invNorm trabaja con la cola izquierda: si el problema te da una probabilidad por la derecha —por ejemplo, «el 10 % de los paquetes más pesados»— réstala de 1 antes de introducirla. «El 10 % superior» empieza donde la probabilidad acumulada izquierda vale 1 − 0,10 = 0,90.

Ejemplo 4 — proceso inverso. Con los paquetes de café del Ejemplo 3 (μ = 250 g, σ = 4 g), una tienda quiere etiquetar como «premium» el 15 % de los paquetes más pesados. ¿A partir de qué masa debe estar un paquete para ser premium?

«El 15 % más pesado» es la cola derecha; se busca el valor a con P(X > a) = 0,15.
Traducir a probabilidad acumulada por la izquierda: P(X < a) = 1 − 0,15 = 0,85.
Usar la normal inversa con probabilidad 0,85, μ = 250, σ = 4. La calculadora devuelve a ≈ 254,1 g (1 decimal).
Comprobación de sentido: 254,1 g está por encima de la media de 250 g, como debe ser para los paquetes «más pesados». Conclusión: un paquete es premium si pesa 254,1 g o más.

Para el examen

Distingue desde la primera lectura qué tipo de problema tienes. Si te dan un valor y piden una probabilidad, es un cálculo directo (función de probabilidad normal). Si te dan una probabilidad o un porcentaje y piden un valor de la variable, es el proceso inverso (función normal inversa). Cinco hábitos que rinden marcas: (i) esboza siempre la campana y sombrea la región; (ii) escribe X ~ N(μ, σ²) con los valores concretos; (iii) para colas derechas, recuerda que la inversa pide la probabilidad por la izquierda, así que resta de 1; (iv) usa la regla 68-95-99,7 solo cuando los límites sean exactamente μ ± σ, μ ± 2σ o μ ± 3σ; (v) redondea las probabilidades a 3 cifras significativas y los valores de la variable según el contexto. En 4.12 verás cómo resolver el caso en que μ o σ sean también desconocidas, mediante la tipificación.