Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Sfida: Pipeline di Pre-Elaborazione | Ingegneria delle Caratteristiche per l'Apprendimento Automatico
Preprocessing dei Dati e Feature Engineering

bookSfida: Pipeline di Pre-Elaborazione

Compito

Swipe to start coding

Ti viene fornito il dataset Titanic dalla libreria seaborn. Il tuo compito è costruire una pipeline completa di preprocessing che esegua tutte le trasformazioni essenziali dei dati utilizzate prima dell'apprendimento automatico.

Segui questi passaggi:

  1. Carica il dataset utilizzando sns.load_dataset("titanic").
  2. Gestisci i valori mancanti:
  • Colonne numeriche → riempi con la media.
  • Colonne categoriche → riempi con la moda.
  1. Codifica le variabili categoriche sex ed embarked utilizzando pd.get_dummies().
  2. Normalizza le colonne numeriche age e fare utilizzando StandardScaler.
  3. Crea una nuova caratteristica family_size = sibsp + parch + 1.
  4. Combina tutte le trasformazioni in una funzione chiamata preprocess_titanic(data) che restituisce il DataFrame finale elaborato.
  5. Assegna il dataset elaborato a una variabile chiamata processed_data.

Stampa le prime 5 righe del DataFrame finale.

Soluzione

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 4
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Suggested prompts:

Can you explain that in simpler terms?

What are the main benefits of this approach?

Are there any common mistakes to avoid with this?

close

Awesome!

Completion rate improved to 8.33

bookSfida: Pipeline di Pre-Elaborazione

Scorri per mostrare il menu

Compito

Swipe to start coding

Ti viene fornito il dataset Titanic dalla libreria seaborn. Il tuo compito è costruire una pipeline completa di preprocessing che esegua tutte le trasformazioni essenziali dei dati utilizzate prima dell'apprendimento automatico.

Segui questi passaggi:

  1. Carica il dataset utilizzando sns.load_dataset("titanic").
  2. Gestisci i valori mancanti:
  • Colonne numeriche → riempi con la media.
  • Colonne categoriche → riempi con la moda.
  1. Codifica le variabili categoriche sex ed embarked utilizzando pd.get_dummies().
  2. Normalizza le colonne numeriche age e fare utilizzando StandardScaler.
  3. Crea una nuova caratteristica family_size = sibsp + parch + 1.
  4. Combina tutte le trasformazioni in una funzione chiamata preprocess_titanic(data) che restituisce il DataFrame finale elaborato.
  5. Assegna il dataset elaborato a una variabile chiamata processed_data.

Stampa le prime 5 righe del DataFrame finale.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 4
single

single

some-alt