Ifyllning av Saknade Värden
Att ta bort saknade värden är inte det enda sättet att hantera dem. Du kan också ersätta alla NaN-värden med ett definierat värde, till exempel med medelvärdet för kolumnen eller med nollor. Detta kan vara användbart i många situationer. Du kommer att lära dig detta i kursen Learning Statistics with Python.
Titta på exemplet där saknade värden i kolumnen 'Age' fylls med medianvärdet för denna kolumn:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Förklaring:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()– med argumentetvalueanger vi för metoden.fillna()vad som ska göras medNaN-värdena. I detta fall tillämpas metoden.fillna()på kolumnen'Age'och alla saknade värden ersätts med medianen för kolumnen;inplace=True– argumentet som används för att spara ändringarna.
Swipe to start coding
Saknade värden kan orsaka problem vid dataanalys. Ett av de vanligaste sätten att hantera dem är att ersätta saknade värden med medelvärdet för kolumnen.
Din uppgift är att:
- Ersätta alla
NaN-värden i kolumnen'Age'med medelvärdet för den kolumnen.
- Använd metoden
.fillna()med argumentenvalue=data['Age'].mean()ochinplace=True.
- Beräkna och skriv ut antalet återstående saknade värden i kolumnen
'Age'.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 3.03
Ifyllning av Saknade Värden
Svep för att visa menyn
Att ta bort saknade värden är inte det enda sättet att hantera dem. Du kan också ersätta alla NaN-värden med ett definierat värde, till exempel med medelvärdet för kolumnen eller med nollor. Detta kan vara användbart i många situationer. Du kommer att lära dig detta i kursen Learning Statistics with Python.
Titta på exemplet där saknade värden i kolumnen 'Age' fylls med medianvärdet för denna kolumn:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Förklaring:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()– med argumentetvalueanger vi för metoden.fillna()vad som ska göras medNaN-värdena. I detta fall tillämpas metoden.fillna()på kolumnen'Age'och alla saknade värden ersätts med medianen för kolumnen;inplace=True– argumentet som används för att spara ändringarna.
Swipe to start coding
Saknade värden kan orsaka problem vid dataanalys. Ett av de vanligaste sätten att hantera dem är att ersätta saknade värden med medelvärdet för kolumnen.
Din uppgift är att:
- Ersätta alla
NaN-värden i kolumnen'Age'med medelvärdet för den kolumnen.
- Använd metoden
.fillna()med argumentenvalue=data['Age'].mean()ochinplace=True.
- Beräkna och skriv ut antalet återstående saknade värden i kolumnen
'Age'.
Lösning
Tack för dina kommentarer!
single