Modelli
Sono stati ora trattati i fondamenti della pre-elaborazione dei dati e della costruzione delle pipeline. Il passo successivo è la modellazione.
Un modello in Scikit-learn è un stimatore che fornisce i metodi .predict() e .score(), insieme a .fit() ereditato da tutti gli stimatori.
.fit()
Una volta che i dati sono stati pre-elaborati e sono pronti per essere utilizzati dal modello, il primo passo nella costruzione di un modello è l'addestramento del modello. Questo viene effettuato utilizzando .fit(X, y).
Per l'apprendimento supervisionato (regressione, classificazione), .fit() richiede sia X che y.
Per l'apprendimento non supervisionato (ad esempio, clustering), si utilizza solo .fit(X). Passare y non genera un errore — viene semplicemente ignorato.
Durante l'addestramento, il modello apprende i pattern necessari per la previsione. Ciò che apprende e la durata dell'addestramento dipendono dall'algoritmo. L'addestramento è spesso la fase più lenta del ML, soprattutto con dataset di grandi dimensioni.
.predict()
Dopo l'addestramento, utilizzare .predict() per generare previsioni:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() valuta un modello addestrato, tipicamente su un set di test:
model.fit(X, y)
model.score(X_test, y_test)
Confronta le predizioni con i target reali. Per impostazione predefinita, la metrica è la accuratezza per la classificazione.
X_test si riferisce alla sottoinsieme del dataset, noto come set di test, utilizzato per valutare le prestazioni di un modello dopo l'addestramento. Contiene le caratteristiche (dati di input). y_test è la corrispondente sottoinsieme di etichette reali per X_test. Insieme, valutano quanto bene il modello predice nuovi dati non visti.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
What are some common algorithms used for modeling in Scikit-learn?
Can you explain the difference between `.fit()`, `.predict()`, and `.score()` in more detail?
How do I choose which metric to use for evaluating my model?
Awesome!
Completion rate improved to 3.13
Modelli
Scorri per mostrare il menu
Sono stati ora trattati i fondamenti della pre-elaborazione dei dati e della costruzione delle pipeline. Il passo successivo è la modellazione.
Un modello in Scikit-learn è un stimatore che fornisce i metodi .predict() e .score(), insieme a .fit() ereditato da tutti gli stimatori.
.fit()
Una volta che i dati sono stati pre-elaborati e sono pronti per essere utilizzati dal modello, il primo passo nella costruzione di un modello è l'addestramento del modello. Questo viene effettuato utilizzando .fit(X, y).
Per l'apprendimento supervisionato (regressione, classificazione), .fit() richiede sia X che y.
Per l'apprendimento non supervisionato (ad esempio, clustering), si utilizza solo .fit(X). Passare y non genera un errore — viene semplicemente ignorato.
Durante l'addestramento, il modello apprende i pattern necessari per la previsione. Ciò che apprende e la durata dell'addestramento dipendono dall'algoritmo. L'addestramento è spesso la fase più lenta del ML, soprattutto con dataset di grandi dimensioni.
.predict()
Dopo l'addestramento, utilizzare .predict() per generare previsioni:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() valuta un modello addestrato, tipicamente su un set di test:
model.fit(X, y)
model.score(X_test, y_test)
Confronta le predizioni con i target reali. Per impostazione predefinita, la metrica è la accuratezza per la classificazione.
X_test si riferisce alla sottoinsieme del dataset, noto come set di test, utilizzato per valutare le prestazioni di un modello dopo l'addestramento. Contiene le caratteristiche (dati di input). y_test è la corrispondente sottoinsieme di etichette reali per X_test. Insieme, valutano quanto bene il modello predice nuovi dati non visti.
Grazie per i tuoi commenti!