4.11 Probabilidad condicionada e independencia

El subtema 4.6 introdujo la probabilidad condicionada como una herramienta de cálculo: la probabilidad de una rama de un árbol cuando ya se ha recorrido la anterior. El subtema NM 4.11 da un paso más y la convierte en un objeto de estudio formal. Aquí la pregunta no es solo «¿cuánto vale P(A|B)?», sino «¿qué nos dice esa probabilidad sobre la relación entre los dos sucesos?».

La respuesta tiene un nombre: independencia. Comprobar si dos sucesos son independientes —si saber uno cambia o no la probabilidad del otro— es una de las destrezas más valoradas del bloque, y la que conecta la probabilidad con la estadística aplicada: los estudios clínicos, las pruebas diagnósticas y el análisis de datos se apoyan, en su base, en distinguir lo que está relacionado de lo que solo coincide.

La definición formal de probabilidad condicionada

De la intuición a la fórmula

Cuando se afirma que un suceso B «ya ha ocurrido», el universo de posibilidades cambia. Antes, cualquier resultado de U era posible; ahora solo lo son los resultados que cumplen B. El espacio muestral se ha restringido a B, y todas las probabilidades hay que recalcularlas dentro de ese universo más pequeño. La probabilidad de A en ese contexto es la probabilidad condicionada P(A|B).

Probabilidad condicionada y regla del producto

La probabilidad de A sabiendo que B ha ocurrido, con P(B) ≠ 0, se define como:

P(A|B) = P(A∩B) / P(B)

Dentro del universo restringido B, lo favorable a A son los resultados que están en A y en B, es decir, A∩B. Despejando se obtiene la regla del producto, igual de importante:

P(A∩B) = P(B) × P(A|B)

Conviene leer la fórmula despacio. El denominador P(B) reemplaza a P(U) = 1 como «total»: ya no se reparte la certeza entre todo el espacio muestral, sino solo entre B. El numerador P(A∩B) es la parte de ese nuevo total que también favorece a A. Por eso P(A|B) suele ser distinta de P(A): cambiar el universo cambia las proporciones.

Ejemplo 1 — condicionada con un dado. Se lanza un dado equilibrado. Sea A = «sale un número primo» y B = «sale un número par». Calcula P(A|B).

Los primos del dado son 2, 3 y 5, así que A = {2, 3, 5} y P(A) = 3/6 = 1/2.
Los pares son 2, 4 y 6, así que B = {2, 4, 6} y P(B) = 3/6 = 1/2.
La intersección A∩B son los números primos y pares a la vez: solo el 2. Luego P(A∩B) = 1/6.
Aplicamos la definición: P(A|B) = P(A∩B)/P(B) = (1/6) ÷ (1/2) = (1/6) × (2/1) = 2/6 = 1/3 ≈ 0,333.
Comprobación con el universo restringido: si sabemos que salió par, el universo es {2, 4, 6} y de esos tres solo el 2 es primo, así que 1/3. Coincide.

Leer la condicionada en una tabla de contingencia

Cuando los datos vienen en una tabla de contingencia —una tabla de doble entrada que clasifica una población según dos criterios—, la probabilidad condicionada se lee casi directamente: basta con mirar la fila o la columna que fija la condición y tomarla como nuevo total.

Ejemplo 2 — condicionada a partir de una tabla. Se encuesta a 200 estudiantes sobre si practican algún deporte y si han elegido itinerario de ciencias. Los resultados son:

	Practica deporte	No practica	Total
Itinerario de ciencias	48	32	80
Otros itinerarios	72	48	120
Total	120	80	200

Se elige un estudiante al azar. Sea C = «cursa ciencias» y D = «practica deporte». Calcula P(C|D).

La condición es D: nos limitamos a la columna «practica deporte», que tiene 120 estudiantes. Ese 120 es el nuevo total.
De esos 120, los que además cursan ciencias son 48 (la casilla C∩D).
P(C|D) = 48/120 = 0,4.
Vía la fórmula: P(C∩D) = 48/200 = 0,24 y P(D) = 120/200 = 0,6, luego P(C|D) = 0,24 ÷ 0,6 = 0,4. Coincide.

Error frecuente

Confundir P(A|B) con P(B|A): el orden de la barra importa, y no son iguales. En el ejemplo 2, P(C|D) = 48/120 = 0,4 (de los deportistas, qué fracción hace ciencias) mientras que P(D|C) = 48/80 = 0,6 (de los de ciencias, qué fracción hace deporte). Misma intersección, distinto denominador, distinto resultado. Identifica siempre cuál es la condición —lo que va después de la barra— y úsalo como total.

Independencia: cuando la condición no cambia nada

Definición y formas equivalentes

Dos sucesos son independientes cuando el conocimiento de que uno ha ocurrido no altera la probabilidad del otro. Saber que B pasó deja la probabilidad de A exactamente donde estaba. En símbolos, la definición intuitiva es:

P(A|B) = P(A) = P(A|B′)

es decir, la probabilidad de A es la misma tanto si B ocurre como si no ocurre. Sustituyendo P(A|B) = P(A) en la regla del producto P(A∩B) = P(B)·P(A|B) se obtiene la forma operativa, la que se usa para comprobar la independencia:

Criterio de independencia

Los sucesos A y B son independientes si, y solo si, se cumple cualquiera de estas condiciones (todas equivalentes):

P(A∩B) = P(A) × P(B) ⇔ P(A|B) = P(A)

Para evaluar la independencia de dos sucesos, calcula por separado P(A)·P(B) y P(A∩B): si coinciden, los sucesos son independientes; si no, son dependientes.

💡 Independencia ≠ incompatibilidad: dos sucesos incompatibles con probabilidad no nula nunca son independientes. Si A y B son incompatibles, P(A∩B) = 0, pero P(A)·P(B) > 0; saber que ocurrió B hace imposible A, lo cual es el cambio de probabilidad más drástico posible. Son ideas opuestas, no sinónimas.

Ejemplo 3 — evaluar la independencia de dos sucesos. Retomamos la tabla del ejemplo 2 (200 estudiantes). ¿Son independientes los sucesos C = «cursa ciencias» y D = «practica deporte»?

Calculamos las probabilidades simples: P(C) = 80/200 = 0,4 y P(D) = 120/200 = 0,6.
El producto: P(C) × P(D) = 0,4 × 0,6 = 0,24.
La intersección observada: P(C∩D) = 48/200 = 0,24.
Como P(C∩D) = 0,24 = P(C)·P(D), los sucesos son independientes.
Comprobación por la otra vía: P(C|D) = 0,4 (lo calculamos en el ejemplo 2) y P(C) = 0,4. Coinciden: practicar deporte no cambia la probabilidad de cursar ciencias.

Ejemplo 4 — un caso de dependencia. En la urna de 5 bolas rojas y 3 azules se extraen dos sin reposición. Sea R₁ = «la primera es roja» y R₂ = «la segunda es roja». ¿Son independientes?

P(R₁) = 5/8. Para P(R₂) hay que considerar los dos caminos hasta la segunda bola: P(R₂) = P(R₁)·P(R₂|R₁) + P(R₁′)·P(R₂|R₁′) = (5/8)(4/7) + (3/8)(5/7).
Cálculo: (5/8)(4/7) = 20/56 y (3/8)(5/7) = 15/56, así que P(R₂) = 35/56 = 5/8.
El producto sería P(R₁)·P(R₂) = (5/8)(5/8) = 25/64 ≈ 0,391.
La intersección real es P(R₁∩R₂) = P(R₁)·P(R₂|R₁) = (5/8)(4/7) = 20/56 = 5/14 ≈ 0,357.
Como 0,357 ≠ 0,391, los sucesos son dependientes. Tiene sentido: sin reposición, que la primera sea roja deja menos rojas para la segunda, así que P(R₂|R₁) = 4/7 ≈ 0,571 es menor que P(R₂) = 5/8 = 0,625.

Una aplicación real: estudios clínicos

La independencia es el concepto que permite leer correctamente los datos de un estudio clínico. Cuando se ensaya un fármaco, la población se clasifica con dos criterios —«recibió el tratamiento» frente a «recibió placebo», y «mejoró» frente a «no mejoró»— en una tabla de contingencia. La pregunta científica «¿funciona el tratamiento?» se traduce en matemáticas como «¿son dependientes los sucesos recibir el tratamiento y mejorar?».

Si los dos sucesos resultaran independientes, P(mejorar | tratamiento) = P(mejorar): la mejora ocurriría con la misma frecuencia con y sin fármaco, señal de que el fármaco no aporta nada. Si son dependientes y además P(mejorar | tratamiento) > P(mejorar | placebo), hay indicio de un efecto real. Comparar P(A|B) con P(A) no es un tecnicismo: es la lógica con la que la medicina decide si una intervención merece la pena. La misma idea reaparecerá en el bloque de estadística inferencial, cuando se contrasten esas diferencias para descartar que se deban al azar.

Para el examen

Cuando una pregunta del IB pida «determinar si A y B son independientes», el método es siempre el mismo y debe verse en la hoja: calcula P(A)·P(B), calcula P(A∩B) y compáralos explícitamente. Escribe la conclusión con la justificación numérica: «como P(A∩B) = … = P(A)·P(B), son independientes», o «como … ≠ …, no son independientes». No basta con afirmar el resultado. Y cuida el orden de la barra: P(A|B) y P(B|A) tienen denominadores distintos. Si los datos vienen en tabla, lee la condicionada como «casilla de la intersección ÷ total de la fila o columna de la condición», que es más rápido y menos propenso a error que pasar por la fórmula.