Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Sfida: Creazione di una Pipeline | Pipeline
Introduzione al ML con Scikit-Learn

bookSfida: Creazione di una Pipeline

In questa sfida, combina tutti i passaggi di pre-elaborazione in un unico pipeline utilizzando il dataset originale penguins.csv.

  1. Rimuovere le due righe con dati insufficienti.
  2. Costruire una pipeline che includa codifica, imputazione e normalizzazione.

È necessario codificare solo due colonne, 'sex' e 'island'. Poiché non si desidera codificare l'intero X, è necessario utilizzare un ColumnTransformer. Successivamente, applicare il SimpleImputer e il StandardScaler all'intero X.

Ecco un promemoria delle funzioni make_column_transformer() e make_pipeline() che utilizzerai.

Compito

Swipe to start coding

Ti viene fornito un DataFrame chiamato df che contiene dati sui pinguini. L'obiettivo è costruire una pipeline di pre-processing che gestisca i valori mancanti, codifichi le colonne categoriche e normalizzi le caratteristiche numeriche.

  1. Importazione della funzione make_pipeline da sklearn.pipeline.
  2. Creazione di un ColumnTransformer chiamato ct che applica un OneHotEncoder alle colonne 'sex' e 'island', mantenendo invariate tutte le altre colonne (remainder='passthrough').
  3. Creazione di una pipeline che includa, nell'ordine, i seguenti passaggi:
  • Il ColumnTransformer definito (ct);
  • Un SimpleImputer con strategia impostata su 'most_frequent';
  • Uno StandardScaler per la normalizzazione delle caratteristiche.
  1. Applicazione della pipeline alla matrice delle caratteristiche X e salvataggio dei dati trasformati in una variabile chiamata X_transformed.

Soluzione

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 4
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

close

Awesome!

Completion rate improved to 3.13

bookSfida: Creazione di una Pipeline

Scorri per mostrare il menu

In questa sfida, combina tutti i passaggi di pre-elaborazione in un unico pipeline utilizzando il dataset originale penguins.csv.

  1. Rimuovere le due righe con dati insufficienti.
  2. Costruire una pipeline che includa codifica, imputazione e normalizzazione.

È necessario codificare solo due colonne, 'sex' e 'island'. Poiché non si desidera codificare l'intero X, è necessario utilizzare un ColumnTransformer. Successivamente, applicare il SimpleImputer e il StandardScaler all'intero X.

Ecco un promemoria delle funzioni make_column_transformer() e make_pipeline() che utilizzerai.

Compito

Swipe to start coding

Ti viene fornito un DataFrame chiamato df che contiene dati sui pinguini. L'obiettivo è costruire una pipeline di pre-processing che gestisca i valori mancanti, codifichi le colonne categoriche e normalizzi le caratteristiche numeriche.

  1. Importazione della funzione make_pipeline da sklearn.pipeline.
  2. Creazione di un ColumnTransformer chiamato ct che applica un OneHotEncoder alle colonne 'sex' e 'island', mantenendo invariate tutte le altre colonne (remainder='passthrough').
  3. Creazione di una pipeline che includa, nell'ordine, i seguenti passaggi:
  • Il ColumnTransformer definito (ct);
  • Un SimpleImputer con strategia impostata su 'most_frequent';
  • Uno StandardScaler per la normalizzazione delle caratteristiche.
  1. Applicazione della pipeline alla matrice delle caratteristiche X e salvataggio dei dati trasformati in una variabile chiamata X_transformed.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 4
single

single

some-alt