Utfylling av Manglende Verdier
Å slette manglende verdier er ikke den eneste måten å bli kvitt dem på. Du kan også erstatte alle NaN-verdier med en definert verdi, for eksempel gjennomsnittet av kolonnen eller nuller. Dette kan være nyttig i mange tilfeller. Du vil lære mer om dette i kurset Learning Statistics with Python.
Se på eksempelet der manglende verdier i kolonnen 'Age' fylles inn med medianverdien for denne kolonnen:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Forklaring:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()– med argumentetvalueangir vi til metoden.fillna()hva som skal gjøres medNaN-verdiene. I dette tilfellet brukte vi metoden.fillna()på kolonnen'Age'og erstattet alle manglende verdier med medianen for kolonnen;inplace=True– argumentet vi kan bruke for å lagre endringene.
Swipe to start coding
Manglende verdier kan skape problemer ved dataanalyse. En av de vanligste metodene for å håndtere dette er å erstatte manglende verdier med gjennomsnittet for kolonnen.
Din oppgave er:
- Erstatt alle
NaN-verdier i kolonnen'Age'med gjennomsnittet for denne kolonnen.
- Bruk metoden
.fillna()med argumentenevalue=data['Age'].mean()oginplace=True.
- Beregn og skriv ut antall gjenværende manglende verdier i kolonnen
'Age'.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Can you explain the difference between using the mean and the median to fill missing values?
What are some other strategies for handling missing data?
Can you show how to fill missing values in multiple columns at once?
Fantastisk!
Completion rate forbedret til 3.03
Utfylling av Manglende Verdier
Sveip for å vise menyen
Å slette manglende verdier er ikke den eneste måten å bli kvitt dem på. Du kan også erstatte alle NaN-verdier med en definert verdi, for eksempel gjennomsnittet av kolonnen eller nuller. Dette kan være nyttig i mange tilfeller. Du vil lære mer om dette i kurset Learning Statistics with Python.
Se på eksempelet der manglende verdier i kolonnen 'Age' fylles inn med medianverdien for denne kolonnen:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Forklaring:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()– med argumentetvalueangir vi til metoden.fillna()hva som skal gjøres medNaN-verdiene. I dette tilfellet brukte vi metoden.fillna()på kolonnen'Age'og erstattet alle manglende verdier med medianen for kolonnen;inplace=True– argumentet vi kan bruke for å lagre endringene.
Swipe to start coding
Manglende verdier kan skape problemer ved dataanalyse. En av de vanligste metodene for å håndtere dette er å erstatte manglende verdier med gjennomsnittet for kolonnen.
Din oppgave er:
- Erstatt alle
NaN-verdier i kolonnen'Age'med gjennomsnittet for denne kolonnen.
- Bruk metoden
.fillna()med argumentenevalue=data['Age'].mean()oginplace=True.
- Beregn og skriv ut antall gjenværende manglende verdier i kolonnen
'Age'.
Løsning
Takk for tilbakemeldingene dine!
single