Summary  
This chapter explains scikit-learn’s core API objects—estimators (with fit), transformers (fit/transform), predictors (predict), and models (score)—and how they fit into a data preprocessing and modeling workflow.  

General domain of usage  
Machine learning pipelines

La biblioteca **scikit-learn** (`sklearn`) proporciona herramientas para el preprocesamiento y modelado. Sus principales tipos de objetos son **estimator**, **transformer**, **predictor** y **model**.

## Estimator

Cualquier clase con `.fit()` es un estimator — **aprende a partir de los datos**.

```python
estimator.fit(X, y)     # supervised  
estimator.fit(X)        # unsupervised
```

## Transformador

Un transformador tiene `.fit()` y `.transform()`, además de `.fit_transform()` para realizar ambos a la vez.

Los transformadores suelen utilizarse para transformar el arreglo `X`. Sin embargo, como veremos en el ejemplo de `LabelEncoder`, algunos transformadores están diseñados para el arreglo `y`.

Nota

Los valores `nan` mostrados en el conjunto de entrenamiento en la imagen indican datos faltantes en Python.

## Predictor

Un predictor es un estimador con `.predict()` para generar salidas.

```python
predictor.fit(X, y)
predictor.predict(X_new)
```

## Modelo

Un modelo es un predictor con `.score()`, que evalúa el rendimiento.

```python
model.fit(X, y)
model.score(X, y)
```

Como se mencionó en el capítulo anterior, **precisión** es una métrica que representa el porcentaje de predicciones correctas.

`.fit()`, `.transform()`, `.fit_transform()`

La etapa de **preprocesamiento** implica trabajar con transformadores, y trabajamos con predictores (más específicamente con modelos) en la etapa de **modelado**.

Selecciona todas las afirmaciones correctas.

El aprendizaje automático se utiliza actualmente en todas partes. ¿Quieres aprenderlo por ti mismo? Este curso es una introducción al mundo del aprendizaje automático para que puedas aprender los conceptos básicos, trabajar con Scikit-learn – la biblioteca más popular para ML – y construir tu primer proyecto de aprendizaje automático.
Este curso está dirigido a estudiantes con conocimientos básicos de Python, Pandas y Numpy.

Aprenda los conceptos de Machine Learning y el flujo de trabajo de un proyecto de ML.

El preprocesamiento es probablemente la etapa más importante de un proyecto de ML. Este capítulo abarca los pasos de preprocesamiento necesarios para casi cualquier conjunto de datos.

Una tubería es una forma ordenada de combinar todos los pasos de preprocesamiento junto con un modelo. Las tuberías facilitan considerablemente el entrenamiento y uso de un modelo.

El modelado es la etapa más divertida de un proyecto de ML. Aprendamos a construir, ajustar y evaluar el modelo.

Conceptos de Scikit-learn

Estimator

Transformador

Predictor

Modelo

Conceptos de Scikit-learn

Estimator

Transformador

Predictor

Modelo