Utfylling av Manglende Verdier
Å slette manglende verdier er ikke den eneste måten å bli kvitt dem på. Du kan også erstatte alle NaN-verdier med en definert verdi, for eksempel gjennomsnittsverdien i kolonnen eller nuller. Dette kan være nyttig i mange tilfeller. Du vil lære dette i kurset Learning Statistics with Python.
Se på eksempelet der manglende verdier i kolonnen 'Age'
fylles med medianverdien for denne kolonnen:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Forklaring:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()
– ved å bruke argumentetvalue
angir vi til.fillna()
-metoden hva som skal gjøres medNaN
-verdiene. I dette tilfellet brukte vi.fillna()
-metoden på kolonnen'Age'
og erstattet alle manglende verdier med medianen for kolonnen;inplace=True
– argumentet vi kan bruke for å lagre endringene.
Swipe to start coding
En av de vanligste metodene for å fylle inn manglende verdier er å erstatte dem med gjennomsnittsverdien for kolonnen. Oppgaven din her er å erstatte NaN
-verdiene i kolonnen 'Age'
med gjennomsnittet av kolonnen (ved å bruke argumentet inplace = True
). Deretter skal du vise summen av de manglende verdiene i kolonnen 'Age'
.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Can you explain the difference between using the mean and the median to fill missing values?
What are some other strategies for handling missing data?
Can you show how to fill missing values in multiple columns at once?
Awesome!
Completion rate improved to 3.03
Utfylling av Manglende Verdier
Sveip for å vise menyen
Å slette manglende verdier er ikke den eneste måten å bli kvitt dem på. Du kan også erstatte alle NaN-verdier med en definert verdi, for eksempel gjennomsnittsverdien i kolonnen eller nuller. Dette kan være nyttig i mange tilfeller. Du vil lære dette i kurset Learning Statistics with Python.
Se på eksempelet der manglende verdier i kolonnen 'Age'
fylles med medianverdien for denne kolonnen:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Forklaring:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()
– ved å bruke argumentetvalue
angir vi til.fillna()
-metoden hva som skal gjøres medNaN
-verdiene. I dette tilfellet brukte vi.fillna()
-metoden på kolonnen'Age'
og erstattet alle manglende verdier med medianen for kolonnen;inplace=True
– argumentet vi kan bruke for å lagre endringene.
Swipe to start coding
En av de vanligste metodene for å fylle inn manglende verdier er å erstatte dem med gjennomsnittsverdien for kolonnen. Oppgaven din her er å erstatte NaN
-verdiene i kolonnen 'Age'
med gjennomsnittet av kolonnen (ved å bruke argumentet inplace = True
). Deretter skal du vise summen av de manglende verdiene i kolonnen 'Age'
.
Løsning
Takk for tilbakemeldingene dine!
single