Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Modelli | Modellazione
Introduzione al Machine Learning con Python

bookModelli

Sono stati ora trattati i fondamenti della pre-elaborazione dei dati e della costruzione delle pipeline. Il passo successivo è la modellazione.

Un modello in Scikit-learn è un stimatore che fornisce i metodi .predict() e .score(), insieme a .fit() ereditato da tutti gli stimatori.

.fit()

Una volta che i dati sono stati pre-elaborati e sono pronti per essere utilizzati dal modello, il primo passo nella costruzione di un modello è l'addestramento del modello. Questo viene effettuato utilizzando .fit(X, y).

Note
Nota

Per l'apprendimento supervisionato (regressione, classificazione), .fit() richiede sia X che y. Per l'apprendimento non supervisionato (ad esempio, clustering), si utilizza solo .fit(X). Passare y non genera un errore — viene semplicemente ignorato.

Durante l'addestramento, il modello apprende i pattern necessari per la previsione. Ciò che apprende e la durata dell'addestramento dipendono dall'algoritmo. L'addestramento è spesso la fase più lenta del ML, soprattutto con dataset di grandi dimensioni.

.predict()

Dopo l'addestramento, utilizzare .predict() per generare previsioni:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() valuta un modello addestrato, tipicamente su un set di test:

model.fit(X, y)
model.score(X_test, y_test)

Confronta le predizioni con i target reali. Per impostazione predefinita, la metrica è la accuratezza per la classificazione.

Note
Nota

X_test si riferisce alla sottoinsieme del dataset, noto come set di test, utilizzato per valutare le prestazioni di un modello dopo l'addestramento. Contiene le caratteristiche (dati di input). y_test è la corrispondente sottoinsieme di etichette reali per X_test. Insieme, valutano quanto bene il modello predice nuovi dati non visti.

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 4. Capitolo 1

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Suggested prompts:

What are some common algorithms used for modeling in Scikit-learn?

Can you explain the difference between `.fit()`, `.predict()`, and `.score()` in more detail?

How do I choose which metric to use for evaluating my model?

Awesome!

Completion rate improved to 3.13

bookModelli

Scorri per mostrare il menu

Sono stati ora trattati i fondamenti della pre-elaborazione dei dati e della costruzione delle pipeline. Il passo successivo è la modellazione.

Un modello in Scikit-learn è un stimatore che fornisce i metodi .predict() e .score(), insieme a .fit() ereditato da tutti gli stimatori.

.fit()

Una volta che i dati sono stati pre-elaborati e sono pronti per essere utilizzati dal modello, il primo passo nella costruzione di un modello è l'addestramento del modello. Questo viene effettuato utilizzando .fit(X, y).

Note
Nota

Per l'apprendimento supervisionato (regressione, classificazione), .fit() richiede sia X che y. Per l'apprendimento non supervisionato (ad esempio, clustering), si utilizza solo .fit(X). Passare y non genera un errore — viene semplicemente ignorato.

Durante l'addestramento, il modello apprende i pattern necessari per la previsione. Ciò che apprende e la durata dell'addestramento dipendono dall'algoritmo. L'addestramento è spesso la fase più lenta del ML, soprattutto con dataset di grandi dimensioni.

.predict()

Dopo l'addestramento, utilizzare .predict() per generare previsioni:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() valuta un modello addestrato, tipicamente su un set di test:

model.fit(X, y)
model.score(X_test, y_test)

Confronta le predizioni con i target reali. Per impostazione predefinita, la metrica è la accuratezza per la classificazione.

Note
Nota

X_test si riferisce alla sottoinsieme del dataset, noto come set di test, utilizzato per valutare le prestazioni di un modello dopo l'addestramento. Contiene le caratteristiche (dati di input). y_test è la corrispondente sottoinsieme di etichette reali per X_test. Insieme, valutano quanto bene il modello predice nuovi dati non visti.

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 4. Capitolo 1
some-alt