Auffüllen der Fehlenden Werte
Das Löschen fehlender Werte ist nicht die einzige Möglichkeit, diese zu entfernen. Sie können auch alle NaN-Werte durch einen definierten Wert ersetzen, zum Beispiel durch den Mittelwert der Spalte oder durch Nullen. Dies kann in vielen Fällen nützlich sein. Sie werden dies im Kurs Learning Statistics with Python erlernen.
Betrachten Sie das Beispiel, bei dem fehlende Werte in der Spalte 'Age'
durch den Medianwert dieser Spalte ersetzt werden:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Erläuterung:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()
– Mit dem Argumentvalue
wird der Methode.fillna()
mitgeteilt, wie mit denNaN
-Werten umzugehen ist. In diesem Fall wurde die Methode.fillna()
auf die Spalte'Age'
angewendet und alle fehlenden Werte durch den Median der Spalte ersetzt;inplace=True
– Das Argument, mit dem die Änderungen gespeichert werden können.
Swipe to start coding
Eine der gebräuchlichsten Methoden zum Auffüllen fehlender Werte ist das Ersetzen durch den Mittelwert der Spalte. Die Aufgabe besteht daher darin, die NaN
-Werte in der Spalte 'Age'
durch den Mittelwert dieser Spalte zu ersetzen (unter Verwendung des Arguments inplace = True
). Anschließend soll die Summe der fehlenden Werte in der Spalte 'Age'
ausgegeben werden.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Can you explain the difference between using the mean and the median to fill missing values?
What are some other strategies for handling missing data?
Can you show how to fill missing values in multiple columns at once?
Awesome!
Completion rate improved to 3.03
Auffüllen der Fehlenden Werte
Swipe um das Menü anzuzeigen
Das Löschen fehlender Werte ist nicht die einzige Möglichkeit, diese zu entfernen. Sie können auch alle NaN-Werte durch einen definierten Wert ersetzen, zum Beispiel durch den Mittelwert der Spalte oder durch Nullen. Dies kann in vielen Fällen nützlich sein. Sie werden dies im Kurs Learning Statistics with Python erlernen.
Betrachten Sie das Beispiel, bei dem fehlende Werte in der Spalte 'Age'
durch den Medianwert dieser Spalte ersetzt werden:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Erläuterung:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()
– Mit dem Argumentvalue
wird der Methode.fillna()
mitgeteilt, wie mit denNaN
-Werten umzugehen ist. In diesem Fall wurde die Methode.fillna()
auf die Spalte'Age'
angewendet und alle fehlenden Werte durch den Median der Spalte ersetzt;inplace=True
– Das Argument, mit dem die Änderungen gespeichert werden können.
Swipe to start coding
Eine der gebräuchlichsten Methoden zum Auffüllen fehlender Werte ist das Ersetzen durch den Mittelwert der Spalte. Die Aufgabe besteht daher darin, die NaN
-Werte in der Spalte 'Age'
durch den Mittelwert dieser Spalte zu ersetzen (unter Verwendung des Arguments inplace = True
). Anschließend soll die Summe der fehlenden Werte in der Spalte 'Age'
ausgegeben werden.
Lösung
Danke für Ihr Feedback!
single