single
Cosa Faremo con i Valori NaN?
Scorri per mostrare il menu
Nel capitolo precedente, hai ottenuto il seguente risultato:
| PassengerId | 0 |
| Survived | 0 |
| Pclass | 0 |
| Name | 0 |
| Sex | 0 |
| Age | 86 |
| SibSp | 0 |
| Parch | 0 |
| Ticket | 0 |
| Fare | 1 |
| Cabin | 327 |
| Embarked | 0 |
Il dataset contiene 418 righe. Osserva la colonna Cabin, dove sono presenti 327 valori mancanti. Non ha senso riempirli perché abbiamo informazioni minime in questa colonna. In questo caso, la soluzione migliore è eliminare la colonna che per noi è priva di significato. Uno dei motivi è che potremmo eliminare solo le righe che contengono valori mancanti, ma non possiamo eliminare 327 righe su 418. Vediamo quindi come procedere.
Per eliminare una colonna, è necessario applicare il metodo .drop() al dataset. La sintassi è la seguente:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Spiegazione:
.drop()- metodo che elimina le colonne;columns = 'column_name'oppurecolumns = ['column_1', 'column_2']- argomento della funzione, dove si specifica il nome o i nomi delle colonne da eliminare;inplace = True- argomento utile di pandas che permette di salvare tutte le modifiche. Può essere utilizzato anche in altre funzioni; ne vedremo alcune più avanti.
Scorri per iniziare a programmare
Il tuo compito è eliminare la colonna con il maggior numero di valori NaN. Segui l'algoritmo:
- Elimina la colonna
'Cabin'utilizzando l'argomentoinplace = True. - Visualizza
5righe casuali del dataset.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione