Summary  
This chapter explains scikit-learn’s core API objects—estimators (with fit), transformers (fit/transform), predictors (predict), and models (score)—and how they fit into a data preprocessing and modeling workflow.  

General domain of usage  
Machine learning pipelines

La libreria **scikit-learn** (`sklearn`) offre strumenti per la pre-elaborazione e la modellazione. I suoi principali tipi di oggetti sono **estimator**, **transformer**, **predictor** e **model**.

## Estimator

Qualsiasi classe con `.fit()` è un estimator — **apprende dai dati**.

```python
estimator.fit(X, y)     # supervised  
estimator.fit(X)        # unsupervised
```

## Trasformatore

Un trasformatore dispone di `.fit()` e `.transform()`, oltre a `.fit_transform()` per eseguire entrambe le operazioni contemporaneamente.

I trasformatori sono solitamente utilizzati per trasformare l'array `X`. Tuttavia, come vedremo nell'esempio di `LabelEncoder`, alcuni trasformatori sono progettati per l'array `y`.

Nota

I valori `nan` mostrati nel set di addestramento nell'immagine indicano dati mancanti in Python.

## Predittore

Un predittore è un estimatore con `.predict()` per generare output.

```python
predictor.fit(X, y)
predictor.predict(X_new)
```

## Modello

Un modello è un predittore con `.score()`, che valuta le prestazioni.

```python
model.fit(X, y)
model.score(X, y)
```

Come menzionato nel capitolo precedente, **accuratezza** è una metrica che rappresenta la percentuale di previsioni corrette.

`.fit()`, `.transform()`, `.fit_transform()`

La fase di **preprocessing** prevede l'utilizzo di transformer, mentre nella fase di **modellazione** si utilizzano predictor (più specificamente, modelli).

Seleziona tutte le affermazioni corrette.

L'apprendimento automatico è ormai utilizzato ovunque. Vuoi impararlo anche tu? Questo corso è un'introduzione al mondo del machine learning per apprendere i concetti di base, lavorare con scikit-learn – la libreria più popolare per ML – e realizzare il tuo primo progetto di machine learning.
Questo corso è rivolto a studenti con conoscenze di base di Python, Pandas e Numpy.

Apprendere i concetti di Machine Learning e il flusso di lavoro di un progetto ML.

Il preprocessing è probabilmente la fase più importante di un progetto di ML. Questo capitolo tratta le fasi di preprocessing necessarie per quasi qualsiasi dataset.

Una pipeline è un modo ordinato per combinare tutti i passaggi di pre-elaborazione insieme a un modello. Le pipeline rendono molto più semplice addestrare e utilizzare un modello.

La modellazione è la fase più interessante di un progetto di ML. Impariamo a costruire, ottimizzare e valutare il modello!

Concetti di Scikit-learn

Estimator

Trasformatore

Predittore

Modello