Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Ifyllning av Saknade Värden | Förbehandling av Data
Avancerade tekniker i pandas

bookIfyllning av Saknade Värden

Att ta bort saknade värden är inte det enda sättet att hantera dem. Du kan också ersätta alla NaN-värden med ett definierat värde, till exempel med medelvärdet för kolumnen eller med nollor. Detta kan vara användbart i många situationer. Du kommer att lära dig detta i kursen Learning Statistics with Python.

Titta på exemplet där saknade värden i kolumnen 'Age' fylls med medianvärdet för denna kolumn:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Förklaring:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() – med argumentet value anger vi för metoden .fillna() vad som ska göras med NaN-värdena. I detta fall tillämpas metoden .fillna() på kolumnen 'Age' och alla saknade värden ersätts med medianen för kolumnen;
  • inplace=True – argumentet som används för att spara ändringarna.
Uppgift

Swipe to start coding

Saknade värden kan orsaka problem vid dataanalys. Ett av de vanligaste sätten att hantera dem är att ersätta saknade värden med medelvärdet för kolumnen.

Din uppgift är att:

  1. Ersätta alla NaN-värden i kolumnen 'Age' med medelvärdet för den kolumnen.
  • Använd metoden .fillna() med argumenten value=data['Age'].mean() och inplace=True.
  1. Beräkna och skriv ut antalet återstående saknade värden i kolumnen 'Age'.

Lösning

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 5. Kapitel 5
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

close

Awesome!

Completion rate improved to 3.03

bookIfyllning av Saknade Värden

Svep för att visa menyn

Att ta bort saknade värden är inte det enda sättet att hantera dem. Du kan också ersätta alla NaN-värden med ett definierat värde, till exempel med medelvärdet för kolumnen eller med nollor. Detta kan vara användbart i många situationer. Du kommer att lära dig detta i kursen Learning Statistics with Python.

Titta på exemplet där saknade värden i kolumnen 'Age' fylls med medianvärdet för denna kolumn:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Förklaring:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() – med argumentet value anger vi för metoden .fillna() vad som ska göras med NaN-värdena. I detta fall tillämpas metoden .fillna() på kolumnen 'Age' och alla saknade värden ersätts med medianen för kolumnen;
  • inplace=True – argumentet som används för att spara ändringarna.
Uppgift

Swipe to start coding

Saknade värden kan orsaka problem vid dataanalys. Ett av de vanligaste sätten att hantera dem är att ersätta saknade värden med medelvärdet för kolumnen.

Din uppgift är att:

  1. Ersätta alla NaN-värden i kolumnen 'Age' med medelvärdet för den kolumnen.
  • Använd metoden .fillna() med argumenten value=data['Age'].mean() och inplace=True.
  1. Beräkna och skriv ut antalet återstående saknade värden i kolumnen 'Age'.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 5. Kapitel 5
single

single

some-alt