Udfyldning af Manglende Værdier
Sletning af manglende værdier er ikke den eneste måde at fjerne dem på. Du kan også erstatte alle NaN'er med en defineret værdi, for eksempel med gennemsnitsværdien for kolonnen eller med nuller. Dette kan være nyttigt i mange tilfælde. Du vil lære dette i kurset Learning Statistics with Python.
Se eksemplet på udfyldning af manglende værdier i kolonnen 'Age' med medianværdien for denne kolonne:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Forklaring:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()– ved at bruge argumentetvalueangiver vi til.fillna()-metoden, hvad der skal gøres medNaN-værdierne. I dette tilfælde anvendte vi.fillna()-metoden på kolonnen'Age'og erstattede alle manglende værdier med medianen for kolonnen;inplace=True– argumentet vi kan bruge for at gemme ændringer.
Swipe to start coding
Manglende værdier kan skabe problemer ved dataanalyse. En af de mest almindelige metoder til at håndtere dem er at erstatte manglende værdier med gennemsnittet af kolonnen.
Din opgave er:
- Erstat alle
NaN-værdier i kolonnen'Age'med gennemsnittet af denne kolonne.
- Brug metoden
.fillna()med argumenternevalue=data['Age'].mean()oginplace=True.
- Beregn og udskriv antallet af resterende manglende værdier i kolonnen
'Age'.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Can you explain the difference between using the mean and the median to fill missing values?
What are some other strategies for handling missing data?
Can you show how to fill missing values in multiple columns at once?
Awesome!
Completion rate improved to 3.03
Udfyldning af Manglende Værdier
Stryg for at vise menuen
Sletning af manglende værdier er ikke den eneste måde at fjerne dem på. Du kan også erstatte alle NaN'er med en defineret værdi, for eksempel med gennemsnitsværdien for kolonnen eller med nuller. Dette kan være nyttigt i mange tilfælde. Du vil lære dette i kurset Learning Statistics with Python.
Se eksemplet på udfyldning af manglende værdier i kolonnen 'Age' med medianværdien for denne kolonne:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Forklaring:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()– ved at bruge argumentetvalueangiver vi til.fillna()-metoden, hvad der skal gøres medNaN-værdierne. I dette tilfælde anvendte vi.fillna()-metoden på kolonnen'Age'og erstattede alle manglende værdier med medianen for kolonnen;inplace=True– argumentet vi kan bruge for at gemme ændringer.
Swipe to start coding
Manglende værdier kan skabe problemer ved dataanalyse. En af de mest almindelige metoder til at håndtere dem er at erstatte manglende værdier med gennemsnittet af kolonnen.
Din opgave er:
- Erstat alle
NaN-værdier i kolonnen'Age'med gennemsnittet af denne kolonne.
- Brug metoden
.fillna()med argumenternevalue=data['Age'].mean()oginplace=True.
- Beregn og udskriv antallet af resterende manglende værdier i kolonnen
'Age'.
Løsning
Tak for dine kommentarer!
single