Udfyldning af Manglende Værdier
Sletning af manglende værdier er ikke den eneste metode til at fjerne dem. Du kan også erstatte alle NaN-værdier med en defineret værdi, for eksempel med gennemsnittet af kolonnen eller med nuller. Dette kan være nyttigt i mange tilfælde. Du vil lære dette i kurset Learning Statistics with Python.
Se eksemplet på udfyldning af manglende værdier i kolonnen 'Age'
med medianværdien for denne kolonne:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Forklaring:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()
– med argumentetvalue
angiver vi til.fillna()
-metoden, hvad der skal gøres medNaN
-værdierne. I dette tilfælde anvender vi.fillna()
-metoden på kolonnen'Age'
og erstatter alle manglende værdier med medianen for kolonnen;inplace=True
– argumentet, der kan bruges til at gemme ændringerne.
Swipe to start coding
En af de mest almindelige metoder til at udfylde manglende værdier er at erstatte dem med gennemsnitsværdien for kolonnen. Din opgave her er derfor at erstatte NaN
-værdierne i kolonnen 'Age'
med gennemsnittet af kolonnen (ved at bruge argumentet inplace = True
). Dernæst skal du udskrive summen af de manglende værdier i kolonnen 'Age'
.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Can you explain the difference between using the mean and the median to fill missing values?
What are some other strategies for handling missing data?
Can you show how to fill missing values in multiple columns at once?
Awesome!
Completion rate improved to 3.03
Udfyldning af Manglende Værdier
Stryg for at vise menuen
Sletning af manglende værdier er ikke den eneste metode til at fjerne dem. Du kan også erstatte alle NaN-værdier med en defineret værdi, for eksempel med gennemsnittet af kolonnen eller med nuller. Dette kan være nyttigt i mange tilfælde. Du vil lære dette i kurset Learning Statistics with Python.
Se eksemplet på udfyldning af manglende værdier i kolonnen 'Age'
med medianværdien for denne kolonne:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Forklaring:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()
– med argumentetvalue
angiver vi til.fillna()
-metoden, hvad der skal gøres medNaN
-værdierne. I dette tilfælde anvender vi.fillna()
-metoden på kolonnen'Age'
og erstatter alle manglende værdier med medianen for kolonnen;inplace=True
– argumentet, der kan bruges til at gemme ændringerne.
Swipe to start coding
En af de mest almindelige metoder til at udfylde manglende værdier er at erstatte dem med gennemsnitsværdien for kolonnen. Din opgave her er derfor at erstatte NaN
-værdierne i kolonnen 'Age'
med gennemsnittet af kolonnen (ved at bruge argumentet inplace = True
). Dernæst skal du udskrive summen af de manglende værdier i kolonnen 'Age'
.
Løsning
Tak for dine kommentarer!
single