📚 Umbrales de clasificación, validación y regularización
Estas referencias profundizan los pilares del capítulo: cómo ajustar umbrales de decisión, evaluar modelos con validación honesta y controlar la complejidad para mantener interpretabilidad en entornos clínicos.
Índice
- Métricas de evaluación y umbrales
- Validación cruzada y remuestreo
- Regularización y control de complejidad
- Casos de estudio en salud
1. Métricas de evaluación y umbrales
| Recurso | Enfoque | Acceso |
|---|---|---|
| Umbrales y matriz de confusión | Simulador interactivo que muestra cómo cambian VP/VN/FP/FN al mover el umbral. | https://developers.google.com/machine-learning/crash-course/classification/thresholding?hl=es |
| Exactitud, recuperación y precisión | Revisión de métricas básicas y su interpretación en el Gestor de Riesgos. | https://developers.google.com/machine-learning/crash-course/classification/accuracy-precision-recall?hl=es |
| ROC y AUC | Explica curvas ROC/AUC y su rol en escenarios desbalanceados. | https://developers.google.com/machine-learning/crash-course/classification/roc-and-auc?hl=es |
| Guía de evaluación de modelos — scikit-learn | Referencia completa sobre matrices de confusión, curvas ROC y calibración. | https://scikit-learn.org/stable/modules/model_evaluation.html |
2. Validación cruzada y remuestreo
| Recurso | Aporte | Acceso |
|---|---|---|
| Validación cruzada — Wikipedia | Panorama general de K-Fold, leave-one-out y antecedentes históricos. | https://es.wikipedia.org/wiki/Validaci%C3%B3n_cruzada_(estad%C3%ADstica) |
| Validación cruzada en scikit-learn | Describe KFold, StratifiedKFold, LeaveOneOut y validación anidada con ejemplos en Python. | https://scikit-learn.org/stable/modules/cross_validation.html |
| Stone, M. (1974). Cross-Validatory Choice and Assessment of Statistical Predictions. | Artículo seminal que formaliza la validación cruzada moderna. | https://projecteuclid.org/journals/journal-of-the-royal-statistical-society-series-b/volume-36/issue-2/Cross-Validatory-Choice-and-Assessment-of-Statistical-Predictions/10.1111/j.2517-6161.1974.tb00994.x.full |
| Arlot, S. y Celisse, A. (2010). A Survey of Cross-Validation Procedures for Model Selection. | Revisión exhaustiva con recomendaciones según el tamaño y el sesgo del conjunto de datos. | https://arxiv.org/abs/0907.3838 |
3. Regularización y control de complejidad
| Recurso | Clave | Acceso |
|---|---|---|
| Regularización — Wikipedia | Introducción en castellano a L1, L2 y penalizaciones para modelos lineales. | https://es.wikipedia.org/wiki/Regularizaci%C3%B3n_(estad%C3%ADstica) |
| Regresión logística en scikit-learn | Explica el hiperparámetro C, los solvers soportados y penalizaciones mixtas. | https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression |
| Hastie, T., Tibshirani, R. y Wainwright, M. (2015). Statistical Learning with Sparsity. | Manual avanzado sobre lasso, ridge y elastic net en alta dimensión. | https://web.stanford.edu/~hastie/StatLearnSparsity/ |
| Ng, A. (2004). Feature Selection, L1 vs. L2 Regularization and Rotational Invariance. | Comparativa teórica y práctica entre penalizaciones L1 y L2. | https://cs229.stanford.edu/notes2020spring/cs229-notes3.pdf |
4. Casos de estudio en salud
| Recurso | Relación con el capítulo | Acceso |
|---|---|---|
| Rajkomar, A. et al. (2018). Scalable and Accurate Deep Learning with Electronic Health Records. | Incluye regresión logística como línea base y evaluación con métricas clínicas. | https://www.nature.com/articles/s41746-018-0029-1 |
| Powers, D. (2011). Evaluation: From Precision, Recall and F-Measure to ROC, Informedness & Markedness. | Explica métricas avanzadas (MCC, Informedness) útiles en cribados médicos. | https://arxiv.org/abs/2010.16061 |
| Chicco, D. y Jurman, G. (2020). The Advantages of the Matthews Correlation Coefficient. | Muestra por qué MCC es robusta frente a clases desbalanceadas. | https://www.nature.com/articles/s41598-020-76158-9 |
| Saito, T. y Rehmsmeier, M. (2015). The Precision-Recall Plot Is More Informative than the ROC Plot. | Justifica el uso de curvas precisión-recall en escenarios con pocas incidencias. | https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0118432 |
Nota: Todos los enlaces se verificaron en octubre de 2025. Para materiales de acceso restringido, utiliza bibliotecas institucionales o repositorios abiertos.