single
Filling in the Missing Values
Stryg for at vise menuen
Sletning af manglende værdier er ikke den eneste måde at fjerne dem på. Du kan også erstatte alle NaN-værdier med en defineret værdi, for eksempel med gennemsnittet af kolonnen eller med nuller. Dette kan være nyttigt i mange tilfælde. Du vil lære om dette i kurset Learning Statistics with Python.
Se eksemplet på udfyldning af manglende værdier i kolonnen 'Age' med medianværdien for denne kolonne:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Forklaring:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()– ved at bruge argumentetvalueangiver vi til.fillna()-metoden, hvad der skal gøres medNaN-værdierne. I dette tilfælde anvender vi.fillna()-metoden på kolonnen'Age'og erstatter alle manglende værdier med medianen for kolonnen;inplace=True– argumentet, der kan bruges til at gemme ændringerne.
Swipe to start coding
Manglende værdier kan skabe problemer ved dataanalyse. En af de mest almindelige metoder til at håndtere dem er at erstatte manglende værdier med gennemsnittet for kolonnen.
Din opgave er:
- Erstat alle
NaN-værdier i kolonnen'Age'med gennemsnittet for denne kolonne.
- Brug metoden
.fillna()med argumenternevalue=data['Age'].mean()oginplace=True.
- Beregn og udskriv antallet af resterende manglende værdier i kolonnen
'Age'.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat