Sfida: Creazione di una Pipeline
In questa sfida, combina tutti i passaggi di pre-elaborazione in un unico pipeline utilizzando il dataset originale penguins.csv.
- Rimuovere le due righe con dati insufficienti.
- Costruire una pipeline che includa codifica, imputazione e normalizzazione.
È necessario codificare solo due colonne, 'sex' e 'island'. Poiché non si desidera codificare l'intero X, è necessario utilizzare un ColumnTransformer. Successivamente, applicare il SimpleImputer e il StandardScaler all'intero X.
Ecco un promemoria delle funzioni make_column_transformer() e make_pipeline() che utilizzerai.
Swipe to start coding
Ti viene fornito un DataFrame chiamato df che contiene dati sui pinguini.
L'obiettivo è costruire una pipeline di pre-processing che gestisca i valori mancanti, codifichi le colonne categoriche e normalizzi le caratteristiche numeriche.
- Importazione della funzione
make_pipelinedasklearn.pipeline. - Creazione di un
ColumnTransformerchiamatoctche applica unOneHotEncoderalle colonne'sex'e'island', mantenendo invariate tutte le altre colonne (remainder='passthrough'). - Creazione di una pipeline che includa, nell'ordine, i seguenti passaggi:
- Il
ColumnTransformerdefinito (ct); - Un
SimpleImputercon strategia impostata su'most_frequent'; - Uno
StandardScalerper la normalizzazione delle caratteristiche.
- Applicazione della pipeline alla matrice delle caratteristiche
Xe salvataggio dei dati trasformati in una variabile chiamataX_transformed.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 3.13
Sfida: Creazione di una Pipeline
Scorri per mostrare il menu
In questa sfida, combina tutti i passaggi di pre-elaborazione in un unico pipeline utilizzando il dataset originale penguins.csv.
- Rimuovere le due righe con dati insufficienti.
- Costruire una pipeline che includa codifica, imputazione e normalizzazione.
È necessario codificare solo due colonne, 'sex' e 'island'. Poiché non si desidera codificare l'intero X, è necessario utilizzare un ColumnTransformer. Successivamente, applicare il SimpleImputer e il StandardScaler all'intero X.
Ecco un promemoria delle funzioni make_column_transformer() e make_pipeline() che utilizzerai.
Swipe to start coding
Ti viene fornito un DataFrame chiamato df che contiene dati sui pinguini.
L'obiettivo è costruire una pipeline di pre-processing che gestisca i valori mancanti, codifichi le colonne categoriche e normalizzi le caratteristiche numeriche.
- Importazione della funzione
make_pipelinedasklearn.pipeline. - Creazione di un
ColumnTransformerchiamatoctche applica unOneHotEncoderalle colonne'sex'e'island', mantenendo invariate tutte le altre colonne (remainder='passthrough'). - Creazione di una pipeline che includa, nell'ordine, i seguenti passaggi:
- Il
ColumnTransformerdefinito (ct); - Un
SimpleImputercon strategia impostata su'most_frequent'; - Uno
StandardScalerper la normalizzazione delle caratteristiche.
- Applicazione della pipeline alla matrice delle caratteristiche
Xe salvataggio dei dati trasformati in una variabile chiamataX_transformed.
Soluzione
Grazie per i tuoi commenti!
single