Was Werden Wir Mit Den NaN-Werten Tun?
Im vorherigen Kapitel haben Sie folgendes Ergebnis erhalten:
PassengerId | 0 |
Survived | 0 |
Pclass | 0 |
Name | 0 |
Sex | 0 |
Age | 86 |
SibSp | 0 |
Parch | 0 |
Ticket | 0 |
Fare | 1 |
Cabin | 327 |
Embarked | 0 |
Der Datensatz umfasst 418 Zeilen. Betrachten Sie die Spalte Cabin
, in der 327
Werte fehlen. Es ergibt keinen Sinn, diese Werte zu ergänzen, da hier nur minimale Informationen vorliegen. In diesem Fall ist es daher am sinnvollsten, die für uns nutzlose Spalte zu löschen. Einer der Gründe ist, dass wir nur die Zeilen mit fehlenden Werten löschen könnten, aber wir können nicht 327 von 418 Zeilen entfernen. Lassen Sie uns also herausfinden, wie dies funktioniert.
Um eine Spalte zu löschen, wenden Sie die Methode .drop()
auf den Datensatz an. Die Syntax ist wie folgt:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Erläuterung:
.drop()
– Methode zum Löschen von Spalten;columns = 'column_name'
odercolumns = ['column_1', 'column_2']
– Argument der Funktion, in dem Sie den Namen oder die Namen der zu löschenden Spalten angeben;inplace = True
– nützliches Argument von pandas, das es ermöglicht, alle Änderungen zu speichern. Dieses Argument kann auch in anderen Funktionen verwendet werden; einige davon werden wir später kennenlernen.
Swipe to start coding
Ihre Aufgabe besteht darin, die Spalte mit den meisten NaN-Werten zu löschen. Befolgen Sie dazu den folgenden Algorithmus:
- Löschen Sie die Spalte
'Cabin'
mit dem Argumentinplace = True
. - Geben Sie
5
zufällige Zeilen des Datensatzes aus.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Can you explain what happens if I don't use `inplace=True`?
What should I do if I want to delete multiple columns at once?
Is there a way to undo the column deletion if I make a mistake?
Awesome!
Completion rate improved to 3.03
Was Werden Wir Mit Den NaN-Werten Tun?
Swipe um das Menü anzuzeigen
Im vorherigen Kapitel haben Sie folgendes Ergebnis erhalten:
PassengerId | 0 |
Survived | 0 |
Pclass | 0 |
Name | 0 |
Sex | 0 |
Age | 86 |
SibSp | 0 |
Parch | 0 |
Ticket | 0 |
Fare | 1 |
Cabin | 327 |
Embarked | 0 |
Der Datensatz umfasst 418 Zeilen. Betrachten Sie die Spalte Cabin
, in der 327
Werte fehlen. Es ergibt keinen Sinn, diese Werte zu ergänzen, da hier nur minimale Informationen vorliegen. In diesem Fall ist es daher am sinnvollsten, die für uns nutzlose Spalte zu löschen. Einer der Gründe ist, dass wir nur die Zeilen mit fehlenden Werten löschen könnten, aber wir können nicht 327 von 418 Zeilen entfernen. Lassen Sie uns also herausfinden, wie dies funktioniert.
Um eine Spalte zu löschen, wenden Sie die Methode .drop()
auf den Datensatz an. Die Syntax ist wie folgt:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Erläuterung:
.drop()
– Methode zum Löschen von Spalten;columns = 'column_name'
odercolumns = ['column_1', 'column_2']
– Argument der Funktion, in dem Sie den Namen oder die Namen der zu löschenden Spalten angeben;inplace = True
– nützliches Argument von pandas, das es ermöglicht, alle Änderungen zu speichern. Dieses Argument kann auch in anderen Funktionen verwendet werden; einige davon werden wir später kennenlernen.
Swipe to start coding
Ihre Aufgabe besteht darin, die Spalte mit den meisten NaN-Werten zu löschen. Befolgen Sie dazu den folgenden Algorithmus:
- Löschen Sie die Spalte
'Cabin'
mit dem Argumentinplace = True
. - Geben Sie
5
zufällige Zeilen des Datensatzes aus.
Lösung
Danke für Ihr Feedback!
single