Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Ifyllning av Saknade Värden | Förbehandling av Data
Avancerade tekniker i pandas

bookIfyllning av Saknade Värden

Att ta bort saknade värden är inte det enda sättet att hantera dem. Du kan även ersätta alla NaN-värden med ett definierat värde, till exempel med medelvärdet för kolumnen eller med nollor. Detta kan vara användbart i många situationer. Du kommer att lära dig mer om detta i kursen Learning Statistics with Python.

Se exemplet på hur man fyller i saknade värden i kolumnen 'Age' med medianvärdet för denna kolumn:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Förklaring:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() – med argumentet value anger vi för metoden .fillna() vad som ska göras med NaN-värdena. I detta fall har vi använt .fillna() på kolumnen 'Age' och ersatt alla saknade värden med kolumnens median;
  • inplace=True – argumentet som används för att spara ändringarna.
Uppgift

Swipe to start coding

Ett av de vanligaste sätten att fylla i saknade värden är att ersätta dem med medelvärdet för kolumnen. Din uppgift här är att ersätta NaN-värdena i kolumnen 'Age' med kolumnens medelvärde (använd argumentet inplace = True). Skriv sedan ut summan av de saknade värdena i kolumnen 'Age'.

Lösning

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 5. Kapitel 5
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Suggested prompts:

Can you explain the difference between using the mean and the median to fill missing values?

What are some other strategies for handling missing data?

Can you show how to fill missing values in multiple columns at once?

close

Awesome!

Completion rate improved to 3.03

bookIfyllning av Saknade Värden

Svep för att visa menyn

Att ta bort saknade värden är inte det enda sättet att hantera dem. Du kan även ersätta alla NaN-värden med ett definierat värde, till exempel med medelvärdet för kolumnen eller med nollor. Detta kan vara användbart i många situationer. Du kommer att lära dig mer om detta i kursen Learning Statistics with Python.

Se exemplet på hur man fyller i saknade värden i kolumnen 'Age' med medianvärdet för denna kolumn:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Förklaring:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() – med argumentet value anger vi för metoden .fillna() vad som ska göras med NaN-värdena. I detta fall har vi använt .fillna() på kolumnen 'Age' och ersatt alla saknade värden med kolumnens median;
  • inplace=True – argumentet som används för att spara ändringarna.
Uppgift

Swipe to start coding

Ett av de vanligaste sätten att fylla i saknade värden är att ersätta dem med medelvärdet för kolumnen. Din uppgift här är att ersätta NaN-värdena i kolumnen 'Age' med kolumnens medelvärde (använd argumentet inplace = True). Skriv sedan ut summan av de saknade värdena i kolumnen 'Age'.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 5. Kapitel 5
single

single

some-alt