Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Sfida: Mettere Tutto Insieme | Modellazione
Introduzione al ML con Scikit-Learn

bookSfida: Mettere Tutto Insieme

In questa sfida, applicare l'intero workflow appreso nel corso — dalla preprocessazione dei dati fino all'addestramento e alla valutazione del modello.

Compito

Swipe to start coding

Ti viene fornito un dataset di pinguini. L'obiettivo è costruire una pipeline di machine learning che classifichi le specie di pinguini utilizzando un modello K-Nearest Neighbors (KNN), gestendo correttamente la codifica, i valori mancanti e l'ottimizzazione dei parametri.

  1. Codifica la variabile target utilizzando LabelEncoder.
  2. Dividi il dataset in set di addestramento e test con test_size=0.33.
  3. Crea un ColumnTransformer (ct) che codifica solo le colonne 'island' e 'sex' utilizzando un encoder adatto per dati nominali (OneHotEncoder) e lascia le altre colonne inalterate.
  4. Definisci una griglia di parametri (param_grid) che includa i seguenti valori per n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Crea un oggetto GridSearchCV con KNeighborsClassifier come stimatore di base e param_grid come parametri.
  6. Costruisci una pipeline composta da:
  • il ColumnTransformer (ct);
  • un SimpleImputer (strategy = 'most_frequent');
  • uno StandardScaler;
  • e il GridSearchCV come passaggio finale.
  1. Allena la pipeline utilizzando i dati di addestramento (X_train, y_train).
  2. Valuta il modello sui dati di test stampando il suo .score(X_test, y_test).
  3. Predici sul set di test e stampa le prime 5 predizioni decodificate utilizzando label_enc.inverse_transform().
  4. Infine, stampa il miglior stimatore trovato da GridSearchCV.

Soluzione

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 4. Capitolo 10
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

close

Awesome!

Completion rate improved to 3.13

bookSfida: Mettere Tutto Insieme

Scorri per mostrare il menu

In questa sfida, applicare l'intero workflow appreso nel corso — dalla preprocessazione dei dati fino all'addestramento e alla valutazione del modello.

Compito

Swipe to start coding

Ti viene fornito un dataset di pinguini. L'obiettivo è costruire una pipeline di machine learning che classifichi le specie di pinguini utilizzando un modello K-Nearest Neighbors (KNN), gestendo correttamente la codifica, i valori mancanti e l'ottimizzazione dei parametri.

  1. Codifica la variabile target utilizzando LabelEncoder.
  2. Dividi il dataset in set di addestramento e test con test_size=0.33.
  3. Crea un ColumnTransformer (ct) che codifica solo le colonne 'island' e 'sex' utilizzando un encoder adatto per dati nominali (OneHotEncoder) e lascia le altre colonne inalterate.
  4. Definisci una griglia di parametri (param_grid) che includa i seguenti valori per n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Crea un oggetto GridSearchCV con KNeighborsClassifier come stimatore di base e param_grid come parametri.
  6. Costruisci una pipeline composta da:
  • il ColumnTransformer (ct);
  • un SimpleImputer (strategy = 'most_frequent');
  • uno StandardScaler;
  • e il GridSearchCV come passaggio finale.
  1. Allena la pipeline utilizzando i dati di addestramento (X_train, y_train).
  2. Valuta il modello sui dati di test stampando il suo .score(X_test, y_test).
  3. Predici sul set di test e stampa le prime 5 predizioni decodificate utilizzando label_enc.inverse_transform().
  4. Infine, stampa il miglior stimatore trovato da GridSearchCV.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 4. Capitolo 10
single

single

some-alt