Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Was Werden Wir Mit Den NaN-Werten Tun? | Datenvorverarbeitung
Fortgeschrittene Techniken in Pandas

bookWas Werden Wir Mit Den NaN-Werten Tun?

Im vorherigen Kapitel haben Sie folgendes Ergebnis erhalten:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

Der Datensatz umfasst 418 Zeilen. Betrachten Sie die Spalte Cabin, in der 327 Werte fehlen. Es ergibt keinen Sinn, diese Werte zu ergänzen, da hier nur minimale Informationen vorliegen. In diesem Fall ist es daher am sinnvollsten, die für uns nutzlose Spalte zu löschen. Einer der Gründe ist, dass wir nur die Zeilen mit fehlenden Werten löschen könnten, aber wir können nicht 327 von 418 Zeilen entfernen. Lassen Sie uns also herausfinden, wie dies funktioniert.

Um eine Spalte zu löschen, wenden Sie die Methode .drop() auf den Datensatz an. Die Syntax ist wie folgt:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Erläuterung:

  • .drop() – Methode zum Löschen von Spalten;
  • columns = 'column_name' oder columns = ['column_1', 'column_2'] – Argument der Funktion, in dem Sie den Namen oder die Namen der zu löschenden Spalten angeben;
  • inplace = True – nützliches Argument von pandas, das es ermöglicht, alle Änderungen zu speichern. Dieses Argument kann auch in anderen Funktionen verwendet werden; einige davon werden wir später kennenlernen.
Aufgabe

Swipe to start coding

Ihre Aufgabe besteht darin, die Spalte mit den meisten NaN-Werten zu löschen. Befolgen Sie dazu den folgenden Algorithmus:

  1. Löschen Sie die Spalte 'Cabin' mit dem Argument inplace = True.
  2. Geben Sie 5 zufällige Zeilen des Datensatzes aus.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 3
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

Can you explain what happens if I don't use `inplace=True`?

What should I do if I want to delete multiple columns at once?

Is there a way to undo the column deletion if I make a mistake?

close

Awesome!

Completion rate improved to 3.03

bookWas Werden Wir Mit Den NaN-Werten Tun?

Swipe um das Menü anzuzeigen

Im vorherigen Kapitel haben Sie folgendes Ergebnis erhalten:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

Der Datensatz umfasst 418 Zeilen. Betrachten Sie die Spalte Cabin, in der 327 Werte fehlen. Es ergibt keinen Sinn, diese Werte zu ergänzen, da hier nur minimale Informationen vorliegen. In diesem Fall ist es daher am sinnvollsten, die für uns nutzlose Spalte zu löschen. Einer der Gründe ist, dass wir nur die Zeilen mit fehlenden Werten löschen könnten, aber wir können nicht 327 von 418 Zeilen entfernen. Lassen Sie uns also herausfinden, wie dies funktioniert.

Um eine Spalte zu löschen, wenden Sie die Methode .drop() auf den Datensatz an. Die Syntax ist wie folgt:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Erläuterung:

  • .drop() – Methode zum Löschen von Spalten;
  • columns = 'column_name' oder columns = ['column_1', 'column_2'] – Argument der Funktion, in dem Sie den Namen oder die Namen der zu löschenden Spalten angeben;
  • inplace = True – nützliches Argument von pandas, das es ermöglicht, alle Änderungen zu speichern. Dieses Argument kann auch in anderen Funktionen verwendet werden; einige davon werden wir später kennenlernen.
Aufgabe

Swipe to start coding

Ihre Aufgabe besteht darin, die Spalte mit den meisten NaN-Werten zu löschen. Befolgen Sie dazu den folgenden Algorithmus:

  1. Löschen Sie die Spalte 'Cabin' mit dem Argument inplace = True.
  2. Geben Sie 5 zufällige Zeilen des Datensatzes aus.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 3
single

single

some-alt