single
Filling in the Missing Values
Svep för att visa menyn
Att ta bort saknade värden är inte det enda sättet att bli av med dem. Du kan också ersätta alla NaN med ett definierat värde, till exempel med medelvärdet för kolumnen eller med nollor. Det kan vara användbart i många fall. Du kommer att lära dig detta i kursen Learning Statistics with Python.
Titta på exemplet där saknade värden i kolumnen 'Age' fylls i med medianvärdet för denna kolumn:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Förklaring:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()– med argumentetvalueanger vi för metoden.fillna()vad som ska göras medNaN-värdena. I detta fall har vi använt metoden.fillna()på kolumnen'Age'och ersatt alla saknade värden med medianen för kolumnen;inplace=True– argumentet vi kan använda för att spara ändringarna.
Svep för att börja koda
Saknade värden kan orsaka problem vid dataanalys. Ett av de vanligaste sätten att hantera dem är att ersätta saknade värden med medelvärdet för kolumnen.
Din uppgift är att:
- Ersätta alla
NaN-värden i kolumnen'Age'med medelvärdet för den kolumnen.
- Använd metoden
.fillna()med argumentenvalue=data['Age'].mean()ochinplace=True.
- Beräkna och skriv ut antalet återstående saknade värden i kolumnen
'Age'.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal