Kursinhalt
Fortgeschrittene Techniken in Pandas
Fortgeschrittene Techniken in Pandas
Was Werden Wir Mit Den NaN-Werten Tun?
Im vorherigen Kapitel haben Sie das Ergebnis erhalten:
PassengerId | 0 |
Survived | 0 |
Pclass | 0 |
Name | 0 |
Sex | 0 |
Age | 86 |
SibSp | 0 |
Parch | 0 |
Ticket | 0 |
Fare | 1 |
Cabin | 327 |
Embarked | 0 |
Der Datensatz hat 418 Zeilen. Schauen Sie sich die Spalte Cabin
an, in der wir 327
fehlende Werte haben. Es macht keinen Sinn, sie auszufüllen, da wir hier nur minimale Informationen haben. In diesem Fall ist die beste Lösung, die Spalte zu löschen, die für uns sinnlos ist. Einer der Gründe ist, dass wir nur die Zeilen löschen können, die fehlende Werte enthalten, aber wir können nicht 327 Zeilen von 418 löschen. Lassen Sie uns herausfinden, wie man das macht.
Um eine Spalte zu löschen, müssen Sie die Methode .drop()
auf den Datensatz anwenden. Die Syntax ist folgende:
Erklärung:
.drop()
- eine Methode, die Spalten löscht;columns = 'column_name'
odercolumns = ['column_1', 'column_2']
- Argument der Funktion, bei dem Sie den Namen oder die Namen der zu löschenden Spalten angeben;inplace = True
- nützliches Argument von pandas, das es uns ermöglicht, alle Änderungen zu speichern. Sie können es auch in anderen Funktionen verwenden; wir werden einige davon später lernen.
Swipe to start coding
Ihre Aufgabe ist es, die Spalte mit der größten Anzahl von NaN-Werten zu löschen. Befolgen Sie den Algorithmus:
- Löschen Sie die Spalte
'Cabin'
mit dem Argumentinplace = True
. - Geben Sie die zufälligen
5
Zeilen des Datensatzes aus.
Lösung
Danke für Ihr Feedback!
Was Werden Wir Mit Den NaN-Werten Tun?
Im vorherigen Kapitel haben Sie das Ergebnis erhalten:
PassengerId | 0 |
Survived | 0 |
Pclass | 0 |
Name | 0 |
Sex | 0 |
Age | 86 |
SibSp | 0 |
Parch | 0 |
Ticket | 0 |
Fare | 1 |
Cabin | 327 |
Embarked | 0 |
Der Datensatz hat 418 Zeilen. Schauen Sie sich die Spalte Cabin
an, in der wir 327
fehlende Werte haben. Es macht keinen Sinn, sie auszufüllen, da wir hier nur minimale Informationen haben. In diesem Fall ist die beste Lösung, die Spalte zu löschen, die für uns sinnlos ist. Einer der Gründe ist, dass wir nur die Zeilen löschen können, die fehlende Werte enthalten, aber wir können nicht 327 Zeilen von 418 löschen. Lassen Sie uns herausfinden, wie man das macht.
Um eine Spalte zu löschen, müssen Sie die Methode .drop()
auf den Datensatz anwenden. Die Syntax ist folgende:
Erklärung:
.drop()
- eine Methode, die Spalten löscht;columns = 'column_name'
odercolumns = ['column_1', 'column_2']
- Argument der Funktion, bei dem Sie den Namen oder die Namen der zu löschenden Spalten angeben;inplace = True
- nützliches Argument von pandas, das es uns ermöglicht, alle Änderungen zu speichern. Sie können es auch in anderen Funktionen verwenden; wir werden einige davon später lernen.
Swipe to start coding
Ihre Aufgabe ist es, die Spalte mit der größten Anzahl von NaN-Werten zu löschen. Befolgen Sie den Algorithmus:
- Löschen Sie die Spalte
'Cabin'
mit dem Argumentinplace = True
. - Geben Sie die zufälligen
5
Zeilen des Datensatzes aus.
Lösung
Danke für Ihr Feedback!