Ifyllning av Saknade Värden
Att ta bort saknade värden är inte det enda sättet att hantera dem. Du kan även ersätta alla NaN-värden med ett definierat värde, till exempel med medelvärdet för kolumnen eller med nollor. Detta kan vara användbart i många situationer. Du kommer att lära dig mer om detta i kursen Learning Statistics with Python.
Se exemplet på hur man fyller i saknade värden i kolumnen 'Age'
med medianvärdet för denna kolumn:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Förklaring:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()
– med argumentetvalue
anger vi för metoden.fillna()
vad som ska göras medNaN
-värdena. I detta fall har vi använt.fillna()
på kolumnen'Age'
och ersatt alla saknade värden med kolumnens median;inplace=True
– argumentet som används för att spara ändringarna.
Swipe to start coding
Ett av de vanligaste sätten att fylla i saknade värden är att ersätta dem med medelvärdet för kolumnen. Din uppgift här är att ersätta NaN
-värdena i kolumnen 'Age'
med kolumnens medelvärde (använd argumentet inplace = True
). Skriv sedan ut summan av de saknade värdena i kolumnen 'Age'
.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Can you explain the difference between using the mean and the median to fill missing values?
What are some other strategies for handling missing data?
Can you show how to fill missing values in multiple columns at once?
Awesome!
Completion rate improved to 3.03
Ifyllning av Saknade Värden
Svep för att visa menyn
Att ta bort saknade värden är inte det enda sättet att hantera dem. Du kan även ersätta alla NaN-värden med ett definierat värde, till exempel med medelvärdet för kolumnen eller med nollor. Detta kan vara användbart i många situationer. Du kommer att lära dig mer om detta i kursen Learning Statistics with Python.
Se exemplet på hur man fyller i saknade värden i kolumnen 'Age'
med medianvärdet för denna kolumn:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Förklaring:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()
– med argumentetvalue
anger vi för metoden.fillna()
vad som ska göras medNaN
-värdena. I detta fall har vi använt.fillna()
på kolumnen'Age'
och ersatt alla saknade värden med kolumnens median;inplace=True
– argumentet som används för att spara ändringarna.
Swipe to start coding
Ett av de vanligaste sätten att fylla i saknade värden är att ersätta dem med medelvärdet för kolumnen. Din uppgift här är att ersätta NaN
-värdena i kolumnen 'Age'
med kolumnens medelvärde (använd argumentet inplace = True
). Skriv sedan ut summan av de saknade värdena i kolumnen 'Age'
.
Lösning
Tack för dina kommentarer!
single