Utfylling av Manglende Verdier
Å slette manglende verdier er ikke den eneste måten å bli kvitt dem på. Du kan også erstatte alle NaN-verdier med en definert verdi, for eksempel gjennomsnittet av kolonnen eller nuller. Dette kan være nyttig i mange tilfeller. Du vil lære mer om dette i kurset Learning Statistics with Python.
Se på eksempelet der manglende verdier i kolonnen 'Age' fylles inn med medianverdien for denne kolonnen:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Forklaring:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()– med argumentetvalueangir vi til metoden.fillna()hva som skal gjøres medNaN-verdiene. I dette tilfellet brukte vi metoden.fillna()på kolonnen'Age'og erstattet alle manglende verdier med medianen for kolonnen;inplace=True– argumentet vi kan bruke for å lagre endringene.
Swipe to start coding
Manglende verdier kan skape problemer ved dataanalyse. En av de vanligste metodene for å håndtere dette er å erstatte manglende verdier med gjennomsnittet for kolonnen.
Din oppgave er:
- Erstatt alle
NaN-verdier i kolonnen'Age'med gjennomsnittet for denne kolonnen.
- Bruk metoden
.fillna()med argumentenevalue=data['Age'].mean()oginplace=True.
- Beregn og skriv ut antall gjenværende manglende verdier i kolonnen
'Age'.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 3.03
Utfylling av Manglende Verdier
Sveip for å vise menyen
Å slette manglende verdier er ikke den eneste måten å bli kvitt dem på. Du kan også erstatte alle NaN-verdier med en definert verdi, for eksempel gjennomsnittet av kolonnen eller nuller. Dette kan være nyttig i mange tilfeller. Du vil lære mer om dette i kurset Learning Statistics with Python.
Se på eksempelet der manglende verdier i kolonnen 'Age' fylles inn med medianverdien for denne kolonnen:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Forklaring:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()– med argumentetvalueangir vi til metoden.fillna()hva som skal gjøres medNaN-verdiene. I dette tilfellet brukte vi metoden.fillna()på kolonnen'Age'og erstattet alle manglende verdier med medianen for kolonnen;inplace=True– argumentet vi kan bruke for å lagre endringene.
Swipe to start coding
Manglende verdier kan skape problemer ved dataanalyse. En av de vanligste metodene for å håndtere dette er å erstatte manglende verdier med gjennomsnittet for kolonnen.
Din oppgave er:
- Erstatt alle
NaN-verdier i kolonnen'Age'med gjennomsnittet for denne kolonnen.
- Bruk metoden
.fillna()med argumentenevalue=data['Age'].mean()oginplace=True.
- Beregn og skriv ut antall gjenværende manglende verdier i kolonnen
'Age'.
Løsning
Takk for tilbakemeldingene dine!
single