Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Cosa Faremo con i Valori NaN? | Pre-Elaborazione dei Dati
Tecniche Avanzate in Pandas

bookCosa Faremo con i Valori NaN?

Nel capitolo precedente, hai ottenuto il seguente risultato:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

Il dataset contiene 418 righe. Osserva la colonna Cabin, dove sono presenti 327 valori mancanti. Non ha senso riempirli, poiché abbiamo informazioni minime a riguardo. In questo caso, la soluzione migliore è eliminare la colonna che per noi non ha utilità. Uno dei motivi è che potremmo eliminare solo le righe che contengono valori mancanti, ma non possiamo eliminare 327 righe su 418. Vediamo quindi come procedere.

Per eliminare una colonna, è necessario applicare il metodo .drop() al dataset. La sintassi è la seguente:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Spiegazione:

  • .drop() - metodo che elimina colonne;
  • columns = 'column_name' oppure columns = ['column_1', 'column_2'] - argomento della funzione in cui si specifica il nome o i nomi delle colonne da eliminare;
  • inplace = True - argomento utile di pandas che consente di salvare tutte le modifiche. Può essere utilizzato anche in altre funzioni; ne vedremo alcune più avanti.
Compito

Swipe to start coding

Il tuo compito è eliminare la colonna con il maggior numero di valori NaN. Segui l'algoritmo:

  1. Elimina la colonna 'Cabin' utilizzando l'argomento inplace = True.
  2. Visualizza 5 righe casuali del dataset.

Soluzione

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 5. Capitolo 3
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

close

Awesome!

Completion rate improved to 3.03

bookCosa Faremo con i Valori NaN?

Scorri per mostrare il menu

Nel capitolo precedente, hai ottenuto il seguente risultato:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

Il dataset contiene 418 righe. Osserva la colonna Cabin, dove sono presenti 327 valori mancanti. Non ha senso riempirli, poiché abbiamo informazioni minime a riguardo. In questo caso, la soluzione migliore è eliminare la colonna che per noi non ha utilità. Uno dei motivi è che potremmo eliminare solo le righe che contengono valori mancanti, ma non possiamo eliminare 327 righe su 418. Vediamo quindi come procedere.

Per eliminare una colonna, è necessario applicare il metodo .drop() al dataset. La sintassi è la seguente:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Spiegazione:

  • .drop() - metodo che elimina colonne;
  • columns = 'column_name' oppure columns = ['column_1', 'column_2'] - argomento della funzione in cui si specifica il nome o i nomi delle colonne da eliminare;
  • inplace = True - argomento utile di pandas che consente di salvare tutte le modifiche. Può essere utilizzato anche in altre funzioni; ne vedremo alcune più avanti.
Compito

Swipe to start coding

Il tuo compito è eliminare la colonna con il maggior numero di valori NaN. Segui l'algoritmo:

  1. Elimina la colonna 'Cabin' utilizzando l'argomento inplace = True.
  2. Visualizza 5 righe casuali del dataset.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 5. Capitolo 3
single

single

some-alt