Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfyldning af Manglende Værdier | Forbehandling af Data
Avancerede Teknikker i Pandas

bookUdfyldning af Manglende Værdier

Sletning af manglende værdier er ikke den eneste metode til at fjerne dem. Du kan også erstatte alle NaN-værdier med en defineret værdi, for eksempel med gennemsnittet af kolonnen eller med nuller. Dette kan være nyttigt i mange tilfælde. Du vil lære dette i kurset Learning Statistics with Python.

Se eksemplet på udfyldning af manglende værdier i kolonnen 'Age' med medianværdien for denne kolonne:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Forklaring:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() – med argumentet value angiver vi til .fillna()-metoden, hvad der skal gøres med NaN-værdierne. I dette tilfælde anvender vi .fillna()-metoden på kolonnen 'Age' og erstatter alle manglende værdier med medianen for kolonnen;
  • inplace=True – argumentet, der kan bruges til at gemme ændringerne.
Opgave

Swipe to start coding

En af de mest almindelige metoder til at udfylde manglende værdier er at erstatte dem med gennemsnitsværdien for kolonnen. Din opgave her er derfor at erstatte NaN-værdierne i kolonnen 'Age' med gennemsnittet af kolonnen (ved at bruge argumentet inplace = True). Dernæst skal du udskrive summen af de manglende værdier i kolonnen 'Age'.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 5
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain the difference between using the mean and the median to fill missing values?

What are some other strategies for handling missing data?

Can you show how to fill missing values in multiple columns at once?

close

Awesome!

Completion rate improved to 3.03

bookUdfyldning af Manglende Værdier

Stryg for at vise menuen

Sletning af manglende værdier er ikke den eneste metode til at fjerne dem. Du kan også erstatte alle NaN-værdier med en defineret værdi, for eksempel med gennemsnittet af kolonnen eller med nuller. Dette kan være nyttigt i mange tilfælde. Du vil lære dette i kurset Learning Statistics with Python.

Se eksemplet på udfyldning af manglende værdier i kolonnen 'Age' med medianværdien for denne kolonne:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Forklaring:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() – med argumentet value angiver vi til .fillna()-metoden, hvad der skal gøres med NaN-værdierne. I dette tilfælde anvender vi .fillna()-metoden på kolonnen 'Age' og erstatter alle manglende værdier med medianen for kolonnen;
  • inplace=True – argumentet, der kan bruges til at gemme ændringerne.
Opgave

Swipe to start coding

En af de mest almindelige metoder til at udfylde manglende værdier er at erstatte dem med gennemsnitsværdien for kolonnen. Din opgave her er derfor at erstatte NaN-værdierne i kolonnen 'Age' med gennemsnittet af kolonnen (ved at bruge argumentet inplace = True). Dernæst skal du udskrive summen af de manglende værdier i kolonnen 'Age'.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 5
single

single

some-alt