Summary  
This chapter explains how to use an estimator’s `.fit()`, `.predict()`, and `.score()` methods to train a model, generate predictions, and evaluate its performance.  

General domain of usage  
Supervised machine learning

Ya se han cubierto los fundamentos de la preprocesamiento de datos y la construcción de pipelines. El siguiente paso es el **modelado**.


Un **modelo** en Scikit-learn es un **estimador** que proporciona los métodos `.predict()` y `.score()`, junto con `.fit()` heredado de todos los estimadores.


## .fit() 

Una vez que los datos están preprocesados y listos para ingresar al modelo, el primer paso para construir un modelo es el **entrenamiento del modelo**. Esto se realiza utilizando `.fit(X, y)`.

Para **aprendizaje supervisado** (regresión, clasificación), `.fit()` requiere tanto `X` como `y`.
Para **aprendizaje no supervisado** (por ejemplo, clustering), solo se llama `.fit(X)`. Pasar `y` no genera un error; simplemente se ignora.

Nota

Durante el entrenamiento, el modelo **aprende** los patrones necesarios para la predicción. Lo que aprende y la duración del entrenamiento dependen del algoritmo. El entrenamiento suele ser la **parte más lenta** del aprendizaje automático, especialmente con conjuntos de datos grandes.

## .predict()

Después del entrenamiento, utiliza `.predict()` para generar predicciones:

```python
model.fit(X, y)
y_pred = model.predict(X_new)
```

## .score()

`.score()` evalúa un modelo entrenado, normalmente sobre un **conjunto de prueba**:

```python
model.fit(X, y)
model.score(X_test, y_test)
```

Compara las predicciones con los valores reales. Por defecto, la métrica es **precisión** para clasificación.

`X_test` se refiere al subconjunto del conjunto de datos, conocido como **conjunto de prueba**, utilizado para evaluar el rendimiento de un modelo después del entrenamiento. Contiene las **características** (datos de entrada). `y_test` es el subconjunto correspondiente de **etiquetas verdaderas** para `X_test`. Juntos, permiten evaluar qué tan bien el modelo predice datos nuevos y no vistos.

El aprendizaje automático se utiliza actualmente en todas partes. ¿Quieres aprenderlo por ti mismo? Este curso es una introducción al mundo del aprendizaje automático para que puedas aprender los conceptos básicos, trabajar con Scikit-learn – la biblioteca más popular para ML – y construir tu primer proyecto de aprendizaje automático.
Este curso está dirigido a estudiantes con conocimientos básicos de Python, Pandas y Numpy.

Aprenda los conceptos de Machine Learning y el flujo de trabajo de un proyecto de ML.

El preprocesamiento es probablemente la etapa más importante de un proyecto de ML. Este capítulo abarca los pasos de preprocesamiento necesarios para casi cualquier conjunto de datos.

Una tubería es una forma ordenada de combinar todos los pasos de preprocesamiento junto con un modelo. Las tuberías facilitan considerablemente el entrenamiento y uso de un modelo.

El modelado es la etapa más divertida de un proyecto de ML. Aprendamos a construir, ajustar y evaluar el modelo.

Modelos

.fit()

.predict()

.score()