Sezione 2. Capitolo 6
single
Sfida: Pre-elaborazione del Dataset
Scorri per mostrare il menu
Compito
Swipe to start coding
Ti viene fornito un dataset sintetico memorizzato nella variabile data. Il tuo compito è gestire i valori mancanti e codificare correttamente le variabili categoriche.
Segui questi passaggi:
- Sostituisci i valori mancanti nella colonna
'Age'con il valore medio di questa colonna. Sovrascrivi la colonna originale con il risultato. - Crea un'istanza di
OneHotEncodere salvala nella variabilecity_encoder. Assicurati di specificaredrop='first'per evitare la trappola delle variabili fittizie. - Per impostazione predefinita, questo encoder restituisce una matrice sparsa. Per renderla compatibile con Pandas in seguito, imposta il parametro
sparse_output=False(oppuresparse=Falseper le versioni precedenti) durante l'inizializzazione, OPPURE aggiungi.toarray()quando trasformi i dati. - Codifica i valori nella colonna
'City'utilizzandocity_encoder.fit_transform()e salva l'array risultante nella variabilecity_encoded. - Crea un'istanza di
OrdinalEncodere salvala nella variabileincome_encoder. Poiché i dati hanno una gerarchia naturale, definisci esplicitamente l'ordine utilizzando il parametrocategories(nota che'Low'<'Middle'<'High'). - Codifica i valori nella colonna
'Income'utilizzandoincome_encodere sovrascrivi la colonna'Income'originale con il risultato.
Soluzione
Tutto è chiaro?
Grazie per i tuoi commenti!
Sezione 2. Capitolo 6
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione