3.3 La regularización: Domador de complejidad
Introducción
El sobreajuste (overfitting) y la regularización son conceptos clave para afrontar un desafío fundamental en el modelado: mientras que un modelo busca la mejor relación en los datos, debe evitar ajustarse en exceso a las particularidades o el ruido de la muestra de entrenamiento. La regularización es precisamente la técnica que nos permite controlar esta complejidad, asegurando que el modelo generalice correctamente y sus predicciones sean fiables con nuevos datos.
Actividad
Laboratorio de Regularización
Cómo explorarlo
- Ajusta la complejidad: Usa el control para aumentar o reducir la flexibilidad del modelo y compara el error de entrenamiento frente al de validación. Observa cómo modelos muy complejos memorizan el ruido.
- Aplica regularización: Cambia a la pestaña Regularización para añadir una penalización (lambda) que frene a los modelos demasiado complejos y mejore la generalización.
- Encuentra el equilibrio óptimo: Pulsa Encontrar Mejor Modelo para que la herramienta busque la combinación que minimiza el error de validación.
Ajuste del Modelo
Curvas de Error
Explorar el Sobreajuste
Ajusta la complejidad del modelo y observa cómo el error de entrenamiento (azul) disminuye, pero el error de validación (naranja) eventualmente aumenta.
¿Qué observas?
- Complejidad baja: El modelo es muy simple y no captura los patrones.
- Complejidad media: Buen equilibrio entre sesgo y varianza.
- Complejidad alta: El modelo memoriza los datos de entrenamiento.
Controlar con Regularización
Ajusta la complejidad y la regularización para encontrar el modelo que mejor generaliza (menor error de validación).
Conceptos Clave
El Dilema del Sobreajuste
Un modelo muy complejo puede memorizar perfectamente los datos de entrenamiento, incluyendo el ruido y las irregularidades. Sin embargo, cuando se enfrenta a nuevos datos, falla estrepitosamente porque ha aprendido patrones que no son realmente generalizables.
La Regularización como Solución
La regularización añade una "penalización" por la complejidad del modelo. Es como decirle: "Está bien que aprendas, pero no te compliques demasiado". Esto fuerza al modelo a encontrar soluciones más simples y generalizables.
Encontrando el Equilibrio
El objetivo es encontrar el punto dulce donde el modelo es lo suficientemente complejo para capturar los patrones importantes, pero no tanto como para memorizar el ruido. Este equilibrio se logra ajustando la fuerza de regularización (lambda).