Summary  
This chapter covers hyperparameter tuning and model evaluation using cross-validation combined with GridSearchCV or RandomizedSearchCV, along with best practices for splitting data into training, validation, and test sets.  

General domain of usage  
Supervised machine learning model selection and evaluation

Ahora sabes cómo construir un **modelo**, utilizar **pipelines** y ajustar **hiperparámetros**. También aprendiste dos métodos de evaluación: división de entrenamiento-prueba y validación cruzada.
El siguiente paso es combinar la evaluación y el ajuste utilizando `GridSearchCV` o `RandomizedSearchCV`.

Dado que nuestro conjunto de datos es pequeño, utilizaremos `GridSearchCV`, pero todo lo mencionado a continuación también se aplica a `RandomizedSearchCV`.

Nota

Dado que la validación cruzada es más estable que una sola división entrenamiento-prueba, el objetivo es lograr la **mayor puntuación de validación cruzada**.
`GridSearchCV` busca entre los hiperparámetros y encuentra aquellos que maximizan esta puntuación. La mejor puntuación se almacena en `.best_score_`.

Los hiperparámetros que funcionan mejor para un conjunto de datos pueden **no generalizarse** cuando llegan nuevos datos.
Por lo tanto, `.best_score_` puede ser mayor que el rendimiento del modelo en datos **completamente no vistos**.

Un flujo de trabajo común: dividir en conjuntos de entrenamiento y prueba; ejecutar validación cruzada en el **conjunto de entrenamiento** para ajustar el modelo; luego evaluar el modelo optimizado en el **conjunto de prueba** para medir el rendimiento en el mundo real.

En resumen:

1. Preprocesar los datos;
2. Dividir en conjuntos de entrenamiento y prueba;
3. Utilizar validación cruzada en el conjunto de entrenamiento para encontrar la mejor configuración;
4. Evaluar en el conjunto de prueba.

El tercer paso generalmente implica probar **múltiples algoritmos** y ajustar sus hiperparámetros para identificar la mejor opción. Por simplicidad, en este curso solo se utilizó un único algoritmo.


Estudiar más

La validación cruzada no siempre es la mejor opción. Para conjuntos de datos grandes, calcular los puntajes de validación cruzada resulta costoso, mientras que una división en entrenamiento y prueba se vuelve más estable gracias al gran conjunto de prueba.

Los conjuntos de datos grandes suelen dividirse en **entrenamiento**, **validación** y **prueba**.
Los hiperparámetros se eligen en función del rendimiento en el **conjunto de validación**.
Finalmente, el modelo seleccionado se evalúa en el **conjunto de prueba** para verificar su capacidad de generalización.

El **conjunto de datos de pingüinos** es pequeño, con solo 342 instancias. Debido a este tamaño limitado, la puntuación de validación cruzada se utilizará para la evaluación en el próximo capítulo.


¿Por qué la validación cruzada es especialmente valiosa para el ajuste de hiperparámetros en conjuntos de datos pequeños, en comparación con conjuntos de datos grandes donde se podrían preferir divisiones de entrenamiento y prueba?

El aprendizaje automático se utiliza actualmente en todas partes. ¿Quieres aprenderlo por ti mismo? Este curso es una introducción al mundo del aprendizaje automático para que puedas aprender los conceptos básicos, trabajar con Scikit-learn – la biblioteca más popular para ML – y construir tu primer proyecto de aprendizaje automático.
Este curso está dirigido a estudiantes con conocimientos básicos de Python, Pandas y Numpy.

Aprenda los conceptos de Machine Learning y el flujo de trabajo de un proyecto de ML.

El preprocesamiento es probablemente la etapa más importante de un proyecto de ML. Este capítulo abarca los pasos de preprocesamiento necesarios para casi cualquier conjunto de datos.

Una tubería es una forma ordenada de combinar todos los pasos de preprocesamiento junto con un modelo. Las tuberías facilitan considerablemente el entrenamiento y uso de un modelo.

El modelado es la etapa más divertida de un proyecto de ML. Aprendamos a construir, ajustar y evaluar el modelo.

Resumen de Modelado