Sfida: Creazione di una Pipeline
In questa sfida, è necessario unire tutti i passaggi di pre-elaborazione che abbiamo eseguito in un'unica pipeline. Il dataset è il file iniziale penguins.csv
da cui siamo partiti.
Il primo passaggio consiste nel rimuovere due righe inutili. Successivamente, dovrai creare una pipeline che includa codifica, imputazione e normalizzazione.
È necessario codificare solo due colonne, 'sex'
e 'island'
. Poiché non si desidera codificare l'intero X
, è necessario utilizzare un ColumnTransformer
. Successivamente, applicare il SimpleImputer
e lo StandardScaler
all'intero X
.
Ecco un promemoria delle funzioni make_column_transformer()
e make_pipeline()
che utilizzerai.
Swipe to start coding
- Importare la funzione corretta per creare una pipeline.
- Creare un
ColumnTransformer
applicando ilOneHotEncoder
solo alle colonne'sex'
e'island'
. - Assicurarsi che tutte le altre colonne rimangano invariate.
- Creare una pipeline contenente il
ct
appena creato, unSimpleImputer
che riempie i valori mancanti con il valore più frequente e unoStandardScaler
come ultimo passaggio. - Trasformare
X
utilizzando lapipe
creata.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 3.13
Sfida: Creazione di una Pipeline
Scorri per mostrare il menu
In questa sfida, è necessario unire tutti i passaggi di pre-elaborazione che abbiamo eseguito in un'unica pipeline. Il dataset è il file iniziale penguins.csv
da cui siamo partiti.
Il primo passaggio consiste nel rimuovere due righe inutili. Successivamente, dovrai creare una pipeline che includa codifica, imputazione e normalizzazione.
È necessario codificare solo due colonne, 'sex'
e 'island'
. Poiché non si desidera codificare l'intero X
, è necessario utilizzare un ColumnTransformer
. Successivamente, applicare il SimpleImputer
e lo StandardScaler
all'intero X
.
Ecco un promemoria delle funzioni make_column_transformer()
e make_pipeline()
che utilizzerai.
Swipe to start coding
- Importare la funzione corretta per creare una pipeline.
- Creare un
ColumnTransformer
applicando ilOneHotEncoder
solo alle colonne'sex'
e'island'
. - Assicurarsi che tutte le altre colonne rimangano invariate.
- Creare una pipeline contenente il
ct
appena creato, unSimpleImputer
che riempie i valori mancanti con il valore più frequente e unoStandardScaler
come ultimo passaggio. - Trasformare
X
utilizzando lapipe
creata.
Soluzione
Grazie per i tuoi commenti!
Awesome!
Completion rate improved to 3.13single