Sfida: Pipeline di Pre-Elaborazione
Swipe to start coding
Ti viene fornito il dataset Titanic dalla libreria seaborn.
Il tuo compito è costruire una pipeline completa di preprocessing che esegua tutte le trasformazioni essenziali dei dati utilizzate prima dell'apprendimento automatico.
Segui questi passaggi:
- Carica il dataset utilizzando
sns.load_dataset("titanic"). - Gestisci i valori mancanti:
- Colonne numeriche → riempi con la media.
- Colonne categoriche → riempi con la moda.
- Codifica le variabili categoriche
sexedembarkedutilizzandopd.get_dummies(). - Normalizza le colonne numeriche
ageefareutilizzandoStandardScaler. - Crea una nuova caratteristica
family_size = sibsp + parch + 1. - Combina tutte le trasformazioni in una funzione chiamata
preprocess_titanic(data)che restituisce il DataFrame finale elaborato. - Assegna il dataset elaborato a una variabile chiamata
processed_data.
Stampa le prime 5 righe del DataFrame finale.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 8.33
Sfida: Pipeline di Pre-Elaborazione
Scorri per mostrare il menu
Swipe to start coding
Ti viene fornito il dataset Titanic dalla libreria seaborn.
Il tuo compito è costruire una pipeline completa di preprocessing che esegua tutte le trasformazioni essenziali dei dati utilizzate prima dell'apprendimento automatico.
Segui questi passaggi:
- Carica il dataset utilizzando
sns.load_dataset("titanic"). - Gestisci i valori mancanti:
- Colonne numeriche → riempi con la media.
- Colonne categoriche → riempi con la moda.
- Codifica le variabili categoriche
sexedembarkedutilizzandopd.get_dummies(). - Normalizza le colonne numeriche
ageefareutilizzandoStandardScaler. - Crea una nuova caratteristica
family_size = sibsp + parch + 1. - Combina tutte le trasformazioni in una funzione chiamata
preprocess_titanic(data)che restituisce il DataFrame finale elaborato. - Assegna il dataset elaborato a una variabile chiamata
processed_data.
Stampa le prime 5 righe del DataFrame finale.
Soluzione
Grazie per i tuoi commenti!
single