Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfyldning af Manglende Værdier | Forbehandling af Data
Avancerede Teknikker i Pandas

bookUdfyldning af Manglende Værdier

Sletning af manglende værdier er ikke den eneste måde at fjerne dem på. Du kan også erstatte alle NaN'er med en defineret værdi, for eksempel med gennemsnitsværdien for kolonnen eller med nuller. Dette kan være nyttigt i mange tilfælde. Du vil lære dette i kurset Learning Statistics with Python.

Se eksemplet på udfyldning af manglende værdier i kolonnen 'Age' med medianværdien for denne kolonne:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Forklaring:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() – ved at bruge argumentet value angiver vi til .fillna()-metoden, hvad der skal gøres med NaN-værdierne. I dette tilfælde anvendte vi .fillna()-metoden på kolonnen 'Age' og erstattede alle manglende værdier med medianen for kolonnen;
  • inplace=True – argumentet vi kan bruge for at gemme ændringer.
Opgave

Swipe to start coding

Manglende værdier kan skabe problemer ved dataanalyse. En af de mest almindelige metoder til at håndtere dem er at erstatte manglende værdier med gennemsnittet af kolonnen.

Din opgave er:

  1. Erstat alle NaN-værdier i kolonnen 'Age' med gennemsnittet af denne kolonne.
  • Brug metoden .fillna() med argumenterne value=data['Age'].mean() og inplace=True.
  1. Beregn og udskriv antallet af resterende manglende værdier i kolonnen 'Age'.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 5
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain the difference between using the mean and the median to fill missing values?

What are some other strategies for handling missing data?

Can you show how to fill missing values in multiple columns at once?

close

Awesome!

Completion rate improved to 3.03

bookUdfyldning af Manglende Værdier

Stryg for at vise menuen

Sletning af manglende værdier er ikke den eneste måde at fjerne dem på. Du kan også erstatte alle NaN'er med en defineret værdi, for eksempel med gennemsnitsværdien for kolonnen eller med nuller. Dette kan være nyttigt i mange tilfælde. Du vil lære dette i kurset Learning Statistics with Python.

Se eksemplet på udfyldning af manglende værdier i kolonnen 'Age' med medianværdien for denne kolonne:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Forklaring:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() – ved at bruge argumentet value angiver vi til .fillna()-metoden, hvad der skal gøres med NaN-værdierne. I dette tilfælde anvendte vi .fillna()-metoden på kolonnen 'Age' og erstattede alle manglende værdier med medianen for kolonnen;
  • inplace=True – argumentet vi kan bruge for at gemme ændringer.
Opgave

Swipe to start coding

Manglende værdier kan skabe problemer ved dataanalyse. En af de mest almindelige metoder til at håndtere dem er at erstatte manglende værdier med gennemsnittet af kolonnen.

Din opgave er:

  1. Erstat alle NaN-værdier i kolonnen 'Age' med gennemsnittet af denne kolonne.
  • Brug metoden .fillna() med argumenterne value=data['Age'].mean() og inplace=True.
  1. Beregn og udskriv antallet af resterende manglende værdier i kolonnen 'Age'.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 5
single

single

some-alt