Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Sfida: Pipeline di Pre-Elaborazione | Ingegneria delle Caratteristiche per l'Apprendimento Automatico
Preprocessing dei Dati e Feature Engineering

bookSfida: Pipeline di Pre-Elaborazione

Compito

Swipe to start coding

Ti viene fornito il dataset Titanic dalla libreria seaborn. Il tuo compito è costruire una pipeline completa di preprocessing che esegua tutte le trasformazioni essenziali dei dati utilizzate prima dell'apprendimento automatico.

Segui questi passaggi:

  1. Carica il dataset utilizzando sns.load_dataset("titanic").
  2. Gestisci i valori mancanti:
  • Colonne numeriche → riempi con la media.
  • Colonne categoriche → riempi con la moda.
  1. Codifica le variabili categoriche sex ed embarked utilizzando pd.get_dummies().
  2. Normalizza le colonne numeriche age e fare utilizzando StandardScaler.
  3. Crea una nuova caratteristica family_size = sibsp + parch + 1.
  4. Combina tutte le trasformazioni in una funzione chiamata preprocess_titanic(data) che restituisce il DataFrame finale elaborato.
  5. Assegna il dataset elaborato a una variabile chiamata processed_data.

Stampa le prime 5 righe del DataFrame finale.

Soluzione

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 4
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

close

Awesome!

Completion rate improved to 8.33

bookSfida: Pipeline di Pre-Elaborazione

Scorri per mostrare il menu

Compito

Swipe to start coding

Ti viene fornito il dataset Titanic dalla libreria seaborn. Il tuo compito è costruire una pipeline completa di preprocessing che esegua tutte le trasformazioni essenziali dei dati utilizzate prima dell'apprendimento automatico.

Segui questi passaggi:

  1. Carica il dataset utilizzando sns.load_dataset("titanic").
  2. Gestisci i valori mancanti:
  • Colonne numeriche → riempi con la media.
  • Colonne categoriche → riempi con la moda.
  1. Codifica le variabili categoriche sex ed embarked utilizzando pd.get_dummies().
  2. Normalizza le colonne numeriche age e fare utilizzando StandardScaler.
  3. Crea una nuova caratteristica family_size = sibsp + parch + 1.
  4. Combina tutte le trasformazioni in una funzione chiamata preprocess_titanic(data) che restituisce il DataFrame finale elaborato.
  5. Assegna il dataset elaborato a una variabile chiamata processed_data.

Stampa le prime 5 righe del DataFrame finale.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 4
single

single

some-alt