Modelli
Hai già appreso le basi della pre-elaborazione dei dati e come costruire pipeline. Ora possiamo passare alla parte interessante, modellazione!
Facciamo un riepilogo su cosa sia un modello. In Scikit-learn, è un stimatore che dispone sia dei metodi .predict()
che .score()
(e, essendo uno stimatore, è presente anche il metodo .fit()
).
.fit()
Una volta che i dati sono stati pre-elaborati e sono pronti per il modello, il primo passo nella costruzione di un modello è l'addestramento del modello. Questo viene effettuato utilizzando .fit(X, y)
.
Durante l'addestramento, un modello apprende tutto ciò di cui ha bisogno per effettuare previsioni. Ciò che il modello apprende e la durata dell'addestramento dipendono dall'algoritmo scelto. Per ogni compito, sono disponibili numerosi modelli, basati su algoritmi differenti. Alcuni si addestrano più lentamente, mentre altri più rapidamente.
Tuttavia, l'addestramento è generalmente l'aspetto più dispendioso in termini di tempo del machine learning. Se il set di addestramento è ampio, un modello potrebbe impiegare minuti, ore o addirittura giorni per addestrarsi.
.predict()
Una volta che il modello è stato addestrato utilizzando il metodo .fit()
, può effettuare previsioni. Effettuare una previsione è semplice come chiamare il metodo .predict()
:
model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction
Di solito, si desidera prevedere un target per nuove istanze, X_new
.
.score()
Il metodo .score()
viene utilizzato per misurare le prestazioni di un modello addestrato. Di solito, viene calcolato sul test set (i capitoli successivi spiegheranno di cosa si tratta). Ecco la sintassi:
model.fit(X, y) # Training the model
model.score(X_test, y_test)
Il metodo .score()
richiede i valori target reali (y_test
nell'esempio). Calcola la previsione per le istanze X_test
e confronta questa previsione con il vero target (y_test
) utilizzando una metrica. Per impostazione predefinita, questa metrica è accuracy per la classificazione.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 3.13
Modelli
Scorri per mostrare il menu
Hai già appreso le basi della pre-elaborazione dei dati e come costruire pipeline. Ora possiamo passare alla parte interessante, modellazione!
Facciamo un riepilogo su cosa sia un modello. In Scikit-learn, è un stimatore che dispone sia dei metodi .predict()
che .score()
(e, essendo uno stimatore, è presente anche il metodo .fit()
).
.fit()
Una volta che i dati sono stati pre-elaborati e sono pronti per il modello, il primo passo nella costruzione di un modello è l'addestramento del modello. Questo viene effettuato utilizzando .fit(X, y)
.
Durante l'addestramento, un modello apprende tutto ciò di cui ha bisogno per effettuare previsioni. Ciò che il modello apprende e la durata dell'addestramento dipendono dall'algoritmo scelto. Per ogni compito, sono disponibili numerosi modelli, basati su algoritmi differenti. Alcuni si addestrano più lentamente, mentre altri più rapidamente.
Tuttavia, l'addestramento è generalmente l'aspetto più dispendioso in termini di tempo del machine learning. Se il set di addestramento è ampio, un modello potrebbe impiegare minuti, ore o addirittura giorni per addestrarsi.
.predict()
Una volta che il modello è stato addestrato utilizzando il metodo .fit()
, può effettuare previsioni. Effettuare una previsione è semplice come chiamare il metodo .predict()
:
model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction
Di solito, si desidera prevedere un target per nuove istanze, X_new
.
.score()
Il metodo .score()
viene utilizzato per misurare le prestazioni di un modello addestrato. Di solito, viene calcolato sul test set (i capitoli successivi spiegheranno di cosa si tratta). Ecco la sintassi:
model.fit(X, y) # Training the model
model.score(X_test, y_test)
Il metodo .score()
richiede i valori target reali (y_test
nell'esempio). Calcola la previsione per le istanze X_test
e confronta questa previsione con il vero target (y_test
) utilizzando una metrica. Per impostazione predefinita, questa metrica è accuracy per la classificazione.
Grazie per i tuoi commenti!