Cosa Faremo con i Valori NaN?
Nel capitolo precedente, hai ottenuto il seguente risultato:
| PassengerId | 0 |
| Survived | 0 |
| Pclass | 0 |
| Name | 0 |
| Sex | 0 |
| Age | 86 |
| SibSp | 0 |
| Parch | 0 |
| Ticket | 0 |
| Fare | 1 |
| Cabin | 327 |
| Embarked | 0 |
Il dataset contiene 418 righe. Osserva la colonna Cabin, dove sono presenti 327 valori mancanti. Non ha senso riempirli perché abbiamo informazioni minime a riguardo. In questo caso, la soluzione migliore è eliminare la colonna che per noi è priva di significato. Uno dei motivi è che potremmo eliminare solo le righe che contengono valori mancanti, ma non possiamo eliminare 327 righe su 418. Vediamo quindi come procedere.
Per eliminare una colonna, è necessario applicare il metodo .drop() al dataset. La sintassi è la seguente:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Spiegazione:
.drop()- metodo che elimina le colonne;columns = 'column_name'oppurecolumns = ['column_1', 'column_2']- argomento della funzione, dove si specifica il nome o i nomi delle colonne da eliminare;inplace = True- argomento utile di pandas che consente di salvare tutte le modifiche. Può essere utilizzato anche in altre funzioni; ne vedremo alcune più avanti.
Swipe to start coding
Il tuo compito è eliminare la colonna con il maggior numero di valori NaN. Segui l'algoritmo:
- Elimina la colonna
'Cabin'utilizzando l'argomentoinplace = True. - Visualizza
5righe casuali del dataset.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 3.03
Cosa Faremo con i Valori NaN?
Scorri per mostrare il menu
Nel capitolo precedente, hai ottenuto il seguente risultato:
| PassengerId | 0 |
| Survived | 0 |
| Pclass | 0 |
| Name | 0 |
| Sex | 0 |
| Age | 86 |
| SibSp | 0 |
| Parch | 0 |
| Ticket | 0 |
| Fare | 1 |
| Cabin | 327 |
| Embarked | 0 |
Il dataset contiene 418 righe. Osserva la colonna Cabin, dove sono presenti 327 valori mancanti. Non ha senso riempirli perché abbiamo informazioni minime a riguardo. In questo caso, la soluzione migliore è eliminare la colonna che per noi è priva di significato. Uno dei motivi è che potremmo eliminare solo le righe che contengono valori mancanti, ma non possiamo eliminare 327 righe su 418. Vediamo quindi come procedere.
Per eliminare una colonna, è necessario applicare il metodo .drop() al dataset. La sintassi è la seguente:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Spiegazione:
.drop()- metodo che elimina le colonne;columns = 'column_name'oppurecolumns = ['column_1', 'column_2']- argomento della funzione, dove si specifica il nome o i nomi delle colonne da eliminare;inplace = True- argomento utile di pandas che consente di salvare tutte le modifiche. Può essere utilizzato anche in altre funzioni; ne vedremo alcune più avanti.
Swipe to start coding
Il tuo compito è eliminare la colonna con il maggior numero di valori NaN. Segui l'algoritmo:
- Elimina la colonna
'Cabin'utilizzando l'argomentoinplace = True. - Visualizza
5righe casuali del dataset.
Soluzione
Grazie per i tuoi commenti!
single