Solo Nivel Superior (NS). La regresión lineal simple estima la relación entre dos variables — una independiente (x) y una dependiente (y) — ajustando una recta de la forma y = a + bx. El coeficiente b indica cuánto cambia y por cada unidad adicional de x. En Gestión Empresarial sirve para pronosticar ventas, demanda o costes y para detectar correlaciones (no causalidad). Contenido OE2 cuantitativo, presente en Prueba 1.
Definiciones clave
Pulsa cada término para ver su definición.
¿Qué es?
La ecuación de la recta de regresión:
y = a + bx
- y — variable dependiente (lo que queremos pronosticar: ventas, demanda).
- x — variable independiente (lo que usamos para pronosticar: temperatura, gasto en publicidad, tiempo).
- a — intersección con el eje y; valor de y cuando x = 0.
- b — pendiente; cuánto cambia y por cada unidad de x.
La recta se ajusta por mínimos cuadrados: minimiza la suma de las distancias verticales al cuadrado entre los puntos reales y la recta. Las fórmulas (a recordar para Prueba 1 NS):
b = Σ((xᵢ − x̄)(yᵢ − ȳ)) / Σ((xᵢ − x̄)²)
a = ȳ − b·x̄
La correlación (r, entre −1 y +1) mide la fuerza y dirección de la relación. Atención: una correlación alta NO implica causalidad; sólo señala que las dos variables se mueven juntas.
¿Cuándo se usa?
- Unidad 4 — pronóstico de demanda en función de gasto publicitario, temperatura, eventos.
- Unidad 5 — relación entre volumen de producción y coste.
- Unidad 2 — relación entre formación de empleados y productividad.
- EI — uso recurrente con datos primarios.
- Prueba 1 — cálculo de la recta y predicción para un valor concreto de x.
¿Cómo se aplica?
- Recoger pares de datos (xᵢ, yᵢ).
- Visualizar con un diagrama de dispersión (scatter plot) para comprobar que la relación parece lineal.
- Calcular las medias x̄ y ȳ.
- Calcular b con la fórmula de los mínimos cuadrados.
- Calcular a = ȳ − b·x̄.
- Predecir sustituyendo x en la ecuación.
- Comentar limitaciones: extrapolar fuera del rango de datos es arriesgado; correlación no es causalidad.
Ejemplo aplicado: Coca-Cola y la temperatura
Una distribuidora de Coca-Cola recoge datos de 5 días sobre la relación entre temperatura máxima del día (ºC) y cajas vendidas en una ciudad mediterránea:
| Temperatura (x) | Cajas vendidas (y) |
|---|---|
| 20 | 40 |
| 25 | 55 |
| 30 | 70 |
| 35 | 85 |
| 40 | 100 |
Cálculos rápidos:
- x̄ = (20+25+30+35+40)/5 = 30 ºC.
- ȳ = (40+55+70+85+100)/5 = 70 cajas.
- b = 3 (por cada grado adicional, se venden 3 cajas más).
- a = 70 − 3·30 = −20.
- Recta: y = −20 + 3x.
Predicción para un día de 32 ºC: y = −20 + 3·32 = 76 cajas. La empresa ya puede preparar el almacén y la flota con un pronóstico cuantitativo.
Limitaciones importantes que el examen valora mencionar:
- El modelo asume linealidad: a 50 ºC habrá un techo (la gente se queda en casa, cierran terrazas).
- Sólo cubre la temperatura; ignora día de la semana, eventos, promociones, lluvia.
- Correlación ≠ causalidad: si subiera la temperatura tras una campaña, parte del aumento sería de la campaña, no del calor.
¿Cómo cae en el examen?
- Prueba 1. "Calcular la ecuación de la recta de regresión y predecir y para un valor concreto de x" — 4-6 puntos, OE2.
- Prueba 2. "Comentar hasta qué punto la recta es fiable para pronosticar ventas" — 4-6 puntos, OE3.
- Trampa habitual: extrapolar fuera del rango de datos sin advertir el riesgo. Si los datos van de 20 a 40 ºC, predecir para 5 ºC o 60 ºC es poco fiable.
Comprueba tu comprensión
✅ 6 preguntas sobre regresión lineal
1. (OE1) En la ecuación y = a + bx, la pendiente "b" representa:
b es la pendiente: cuánto sube (o baja, si negativa) y por cada unidad adicional de x. "a" es la intersección con el eje y, no la pendiente.
2. (OE2) En el ejemplo de Coca-Cola, b = 3 significa que:
La pendiente es el ratio de cambio de y respecto de x. Aquí dice: +1 ºC ⇒ +3 cajas, en el rango de temperaturas observado (20-40 ºC).
3. (OE2) Predicción con y = −20 + 3x para x = 38 ºC:
y = −20 + 3·38 = −20 + 114 = 94 cajas.
4. (OE3) Predecir las ventas para 60 ºC usando el modelo de Coca-Cola sería:
La recta sólo describe lo que ocurre dentro del rango de datos. Fuera (extrapolación), la relación puede cambiar: a 60 ºC la gente se queda en casa, las terrazas cierran y las ventas dejarían de subir.
5. (OE3) Un coeficiente de correlación r = +0,95 indica:
r = +0,95 es correlación positiva muy fuerte. Pero correlación ≠ causalidad: pueden subir juntas porque ambas dependen de una tercera variable común.
6. (OE3) ¿Cuál es la principal limitación de la regresión lineal simple?
La regresión simple relaciona dos variables y asume linealidad. La realidad suele depender de varios factores a la vez: para esos casos hay regresión múltiple (no exigida por el syllabus NS).