Sfida: Pipeline di Pre-Elaborazione
Swipe to start coding
Ti viene fornito il dataset Titanic dalla libreria seaborn.
Il tuo compito è costruire una pipeline completa di preprocessing che esegua tutte le trasformazioni essenziali dei dati utilizzate prima dell'apprendimento automatico.
Segui questi passaggi:
- Carica il dataset utilizzando
sns.load_dataset("titanic"). - Gestisci i valori mancanti:
- Colonne numeriche → riempi con la media.
- Colonne categoriche → riempi con la moda.
- Codifica le variabili categoriche
sexedembarkedutilizzandopd.get_dummies(). - Normalizza le colonne numeriche
ageefareutilizzandoStandardScaler. - Crea una nuova caratteristica
family_size = sibsp + parch + 1. - Combina tutte le trasformazioni in una funzione chiamata
preprocess_titanic(data)che restituisce il DataFrame finale elaborato. - Assegna il dataset elaborato a una variabile chiamata
processed_data.
Stampa le prime 5 righe del DataFrame finale.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Can you explain that in simpler terms?
What are the main benefits of this approach?
Are there any common mistakes to avoid with this?
Awesome!
Completion rate improved to 8.33
Sfida: Pipeline di Pre-Elaborazione
Scorri per mostrare il menu
Swipe to start coding
Ti viene fornito il dataset Titanic dalla libreria seaborn.
Il tuo compito è costruire una pipeline completa di preprocessing che esegua tutte le trasformazioni essenziali dei dati utilizzate prima dell'apprendimento automatico.
Segui questi passaggi:
- Carica il dataset utilizzando
sns.load_dataset("titanic"). - Gestisci i valori mancanti:
- Colonne numeriche → riempi con la media.
- Colonne categoriche → riempi con la moda.
- Codifica le variabili categoriche
sexedembarkedutilizzandopd.get_dummies(). - Normalizza le colonne numeriche
ageefareutilizzandoStandardScaler. - Crea una nuova caratteristica
family_size = sibsp + parch + 1. - Combina tutte le trasformazioni in una funzione chiamata
preprocess_titanic(data)che restituisce il DataFrame finale elaborato. - Assegna il dataset elaborato a una variabile chiamata
processed_data.
Stampa le prime 5 righe del DataFrame finale.
Soluzione
Grazie per i tuoi commenti!
single