Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfyldning af Manglende Værdier | Forbehandling af Data
Data Wrangling med Pandas

bookUdfyldning af Manglende Værdier

Sletning af manglende værdier er ikke den eneste måde at fjerne dem på. Du kan også erstatte alle NaN'er med en defineret værdi, for eksempel med gennemsnitsværdien for kolonnen eller med nuller. Dette kan være nyttigt i mange tilfælde. Du vil lære dette i kurset Learning Statistics with Python.

Se eksemplet på udfyldning af manglende værdier i kolonnen 'Age' med medianværdien for denne kolonne:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Forklaring:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() – ved at bruge argumentet value angiver vi til .fillna()-metoden, hvad der skal gøres med NaN-værdierne. I dette tilfælde anvendte vi .fillna()-metoden på kolonnen 'Age' og erstattede alle manglende værdier med medianen for kolonnen;
  • inplace=True – argumentet vi kan bruge for at gemme ændringer.
Opgave

Swipe to start coding

Manglende værdier kan skabe problemer ved dataanalyse. En af de mest almindelige metoder til at håndtere dem er at erstatte manglende værdier med gennemsnittet af kolonnen.

Din opgave er:

  1. Erstat alle NaN-værdier i kolonnen 'Age' med gennemsnittet af denne kolonne.
  • Brug metoden .fillna() med argumenterne value=data['Age'].mean() og inplace=True.
  1. Beregn og udskriv antallet af resterende manglende værdier i kolonnen 'Age'.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 5
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

close

Awesome!

Completion rate improved to 3.03

bookUdfyldning af Manglende Værdier

Stryg for at vise menuen

Sletning af manglende værdier er ikke den eneste måde at fjerne dem på. Du kan også erstatte alle NaN'er med en defineret værdi, for eksempel med gennemsnitsværdien for kolonnen eller med nuller. Dette kan være nyttigt i mange tilfælde. Du vil lære dette i kurset Learning Statistics with Python.

Se eksemplet på udfyldning af manglende værdier i kolonnen 'Age' med medianværdien for denne kolonne:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Forklaring:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() – ved at bruge argumentet value angiver vi til .fillna()-metoden, hvad der skal gøres med NaN-værdierne. I dette tilfælde anvendte vi .fillna()-metoden på kolonnen 'Age' og erstattede alle manglende værdier med medianen for kolonnen;
  • inplace=True – argumentet vi kan bruge for at gemme ændringer.
Opgave

Swipe to start coding

Manglende værdier kan skabe problemer ved dataanalyse. En af de mest almindelige metoder til at håndtere dem er at erstatte manglende værdier med gennemsnittet af kolonnen.

Din opgave er:

  1. Erstat alle NaN-værdier i kolonnen 'Age' med gennemsnittet af denne kolonne.
  • Brug metoden .fillna() med argumenterne value=data['Age'].mean() og inplace=True.
  1. Beregn og udskriv antallet af resterende manglende værdier i kolonnen 'Age'.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 5
single

single

some-alt