Cosa Faremo con i Valori NaN?
Nel capitolo precedente, hai ottenuto il seguente risultato:
PassengerId | 0 |
Survived | 0 |
Pclass | 0 |
Name | 0 |
Sex | 0 |
Age | 86 |
SibSp | 0 |
Parch | 0 |
Ticket | 0 |
Fare | 1 |
Cabin | 327 |
Embarked | 0 |
Il dataset contiene 418 righe. Osserva la colonna Cabin
, dove sono presenti 327
valori mancanti. Non ha senso riempirli, poiché abbiamo informazioni minime a riguardo. In questo caso, la soluzione migliore è eliminare la colonna che per noi non ha utilità. Uno dei motivi è che potremmo eliminare solo le righe che contengono valori mancanti, ma non possiamo eliminare 327 righe su 418. Vediamo quindi come procedere.
Per eliminare una colonna, è necessario applicare il metodo .drop()
al dataset. La sintassi è la seguente:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Spiegazione:
.drop()
- metodo che elimina colonne;columns = 'column_name'
oppurecolumns = ['column_1', 'column_2']
- argomento della funzione in cui si specifica il nome o i nomi delle colonne da eliminare;inplace = True
- argomento utile di pandas che consente di salvare tutte le modifiche. Può essere utilizzato anche in altre funzioni; ne vedremo alcune più avanti.
Swipe to start coding
Il tuo compito è eliminare la colonna con il maggior numero di valori NaN. Segui l'algoritmo:
- Elimina la colonna
'Cabin'
utilizzando l'argomentoinplace = True
. - Visualizza
5
righe casuali del dataset.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 3.03
Cosa Faremo con i Valori NaN?
Scorri per mostrare il menu
Nel capitolo precedente, hai ottenuto il seguente risultato:
PassengerId | 0 |
Survived | 0 |
Pclass | 0 |
Name | 0 |
Sex | 0 |
Age | 86 |
SibSp | 0 |
Parch | 0 |
Ticket | 0 |
Fare | 1 |
Cabin | 327 |
Embarked | 0 |
Il dataset contiene 418 righe. Osserva la colonna Cabin
, dove sono presenti 327
valori mancanti. Non ha senso riempirli, poiché abbiamo informazioni minime a riguardo. In questo caso, la soluzione migliore è eliminare la colonna che per noi non ha utilità. Uno dei motivi è che potremmo eliminare solo le righe che contengono valori mancanti, ma non possiamo eliminare 327 righe su 418. Vediamo quindi come procedere.
Per eliminare una colonna, è necessario applicare il metodo .drop()
al dataset. La sintassi è la seguente:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Spiegazione:
.drop()
- metodo che elimina colonne;columns = 'column_name'
oppurecolumns = ['column_1', 'column_2']
- argomento della funzione in cui si specifica il nome o i nomi delle colonne da eliminare;inplace = True
- argomento utile di pandas che consente di salvare tutte le modifiche. Può essere utilizzato anche in altre funzioni; ne vedremo alcune più avanti.
Swipe to start coding
Il tuo compito è eliminare la colonna con il maggior numero di valori NaN. Segui l'algoritmo:
- Elimina la colonna
'Cabin'
utilizzando l'argomentoinplace = True
. - Visualizza
5
righe casuali del dataset.
Soluzione
Grazie per i tuoi commenti!
single