Auffüllen der Fehlenden Werte
Das Löschen fehlender Werte ist nicht die einzige Möglichkeit, diese zu entfernen. Sie können auch alle NaN-Werte durch einen definierten Wert ersetzen, beispielsweise durch den Mittelwert der Spalte oder durch Nullen. Dies kann in vielen Fällen nützlich sein. Sie lernen dies im Kurs Learning Statistics with Python.
Sehen Sie sich das Beispiel an, in dem fehlende Werte in der Spalte 'Age' mit dem Medianwert dieser Spalte aufgefüllt werden:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Erläuterung:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()– Mit dem Argumentvaluegeben wir der Methode.fillna()an, wie mit denNaN-Werten umzugehen ist. In diesem Fall wenden wir die Methode.fillna()auf die Spalte'Age'an und ersetzen alle fehlenden Werte durch den Median der Spalte;inplace=True– Das Argument, mit dem die Änderungen gespeichert werden.
Swipe to start coding
Fehlende Werte können bei der Datenanalyse zu Problemen führen. Eine der gebräuchlichsten Methoden, um damit umzugehen, ist das Ersetzen fehlender Werte durch den Mittelwert der Spalte.
Ihre Aufgabe ist es:
- Alle
NaN-Werte in der Spalte'Age'durch den Mittelwert dieser Spalte zu ersetzen.
- Verwenden Sie die Methode
.fillna()mit den Argumentenvalue=data['Age'].mean()undinplace=True.
- Berechnen und geben Sie die Anzahl der verbleibenden fehlenden Werte in der Spalte
'Age'aus.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 3.03
Auffüllen der Fehlenden Werte
Swipe um das Menü anzuzeigen
Das Löschen fehlender Werte ist nicht die einzige Möglichkeit, diese zu entfernen. Sie können auch alle NaN-Werte durch einen definierten Wert ersetzen, beispielsweise durch den Mittelwert der Spalte oder durch Nullen. Dies kann in vielen Fällen nützlich sein. Sie lernen dies im Kurs Learning Statistics with Python.
Sehen Sie sich das Beispiel an, in dem fehlende Werte in der Spalte 'Age' mit dem Medianwert dieser Spalte aufgefüllt werden:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Erläuterung:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()– Mit dem Argumentvaluegeben wir der Methode.fillna()an, wie mit denNaN-Werten umzugehen ist. In diesem Fall wenden wir die Methode.fillna()auf die Spalte'Age'an und ersetzen alle fehlenden Werte durch den Median der Spalte;inplace=True– Das Argument, mit dem die Änderungen gespeichert werden.
Swipe to start coding
Fehlende Werte können bei der Datenanalyse zu Problemen führen. Eine der gebräuchlichsten Methoden, um damit umzugehen, ist das Ersetzen fehlender Werte durch den Mittelwert der Spalte.
Ihre Aufgabe ist es:
- Alle
NaN-Werte in der Spalte'Age'durch den Mittelwert dieser Spalte zu ersetzen.
- Verwenden Sie die Methode
.fillna()mit den Argumentenvalue=data['Age'].mean()undinplace=True.
- Berechnen und geben Sie die Anzahl der verbleibenden fehlenden Werte in der Spalte
'Age'aus.
Lösung
Danke für Ihr Feedback!
single