Summary  
This chapter explains how to use an estimator’s `.fit()`, `.predict()`, and `.score()` methods to train a model, generate predictions, and evaluate its performance.  

General domain of usage  
Supervised machine learning

Sono stati ora trattati i fondamenti della pre-elaborazione dei dati e della costruzione delle pipeline. Il passo successivo è la **modellazione**.


Un **modello** in Scikit-learn è un **stimatore** che fornisce i metodi `.predict()` e `.score()`, insieme a `.fit()` ereditato da tutti gli stimatori.


## .fit() 

Una volta che i dati sono stati preprocessati e sono pronti per essere utilizzati dal modello, il primo passo nella costruzione di un modello è **l'addestramento del modello**. Questo viene effettuato utilizzando `.fit(X, y)`.

Per **apprendimento supervisionato** (regressione, classificazione), `.fit()` richiede sia `X` che `y`.
Per **apprendimento non supervisionato** (ad esempio, clustering), si utilizza solo `.fit(X)`. Passare `y` non genera un errore — viene semplicemente ignorato.

Nota

Durante l'addestramento, il modello **apprende** i pattern necessari per la previsione. Ciò che viene appreso e la durata dell'addestramento dipendono dall'algoritmo. L'addestramento è spesso la **fase più lenta** del ML, soprattutto con dataset di grandi dimensioni.

## .predict()

Dopo l'addestramento, utilizzare `.predict()` per generare previsioni:

```python
model.fit(X, y)
y_pred = model.predict(X_new)
```

## .score()

`.score()` valuta un modello addestrato, tipicamente su un **test set**:

```python
model.fit(X, y)
model.score(X_test, y_test)
```

Confronta le previsioni con i target reali. Per impostazione predefinita, la metrica è **accuracy** per la classificazione.

`X_test` si riferisce alla sottoinsieme del dataset, noto come **test set**, utilizzato per valutare le prestazioni di un modello dopo l'addestramento. Contiene le **caratteristiche** (dati di input). `y_test` è la corrispondente sottoinsieme di **etichette reali** per `X_test`. Insieme, valutano quanto bene il modello predice nuovi dati non visti.

L'apprendimento automatico è ormai utilizzato ovunque. Vuoi impararlo anche tu? Questo corso è un'introduzione al mondo del machine learning per apprendere i concetti di base, lavorare con scikit-learn – la libreria più popolare per ML – e realizzare il tuo primo progetto di machine learning.
Questo corso è rivolto a studenti con conoscenze di base di Python, Pandas e Numpy.

Apprendere i concetti di Machine Learning e il flusso di lavoro di un progetto ML.

Il preprocessing è probabilmente la fase più importante di un progetto di ML. Questo capitolo tratta le fasi di preprocessing necessarie per quasi qualsiasi dataset.

Una pipeline è un modo ordinato per combinare tutti i passaggi di pre-elaborazione insieme a un modello. Le pipeline rendono molto più semplice addestrare e utilizzare un modello.

La modellazione è la fase più interessante di un progetto di ML. Impariamo a costruire, ottimizzare e valutare il modello!

Modelli

.fit()

.predict()

.score()