Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Oprettelse af Tæthedsdiagrammer | Datavisualisering
Dataanalyse med R

bookOprettelse af Tæthedsdiagrammer

Hvorfor bruge tæthedsplot?

Et tæthedsplot er en udglattet version af et histogram. Det er nyttigt til at:

  • Forstå fordelingen af en numerisk variabel;
  • Sammenligne fordelinger på tværs af grupper (som brændstoftyper);
  • Identificere toppe, skævhed og spredning.

I modsætning til histogrammer estimerer tæthedsplot sandsynligheden for, at en værdi forekommer inden for et interval.

Tæthedsplot-syntaks i ggplot2

I ggplot2 kan et tæthedsplot oprettes med geom_density().

ggplot(data = df, aes(x = variable)) +
  geom_density()

For at sammenligne grupper kan du tilknytte en kategorisk variabel til fill og justere gennemsigtigheden med alpha, så kurverne overlapper tydeligt.

ggplot(data = df, aes(x = variable, fill = group_variable)) +
  geom_density(alpha = 0.5)

Dette gør det nemt at sammenligne, hvordan fordelingen af en numerisk variabel varierer på tværs af kategorier.

Eksempel: Fordeling af salgspriser

Et tæthedsplot giver en glat repræsentation af, hvordan bilpriser er fordelt. I dette eksempel er kurven udfyldt med blå, og akseetiketter præciserer betydningen af værdierne.

ggplot(df, aes(x = selling_price)) +
  geom_density(fill = "blue") +
  labs(title = "Density Plot of Selling Prices",
       x = "Selling Price",
       y = "Density")

Denne visualisering fremhæver, hvor de fleste bilpriser samler sig, samt hvor bredt priserne er fordelt i datasættet. Det er særligt nyttigt til at identificere toppe i fordelingen og sammenligne med andre variabler senere.

question mark

Hvilket argument styrer gennemsigtigheden af overlappende tæthedsplots?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 4

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

What is the difference between a density plot and a histogram?

How do I interpret the peaks and tails in a density plot?

Can you explain how to compare distributions using density plots?

Awesome!

Completion rate improved to 4

bookOprettelse af Tæthedsdiagrammer

Stryg for at vise menuen

Hvorfor bruge tæthedsplot?

Et tæthedsplot er en udglattet version af et histogram. Det er nyttigt til at:

  • Forstå fordelingen af en numerisk variabel;
  • Sammenligne fordelinger på tværs af grupper (som brændstoftyper);
  • Identificere toppe, skævhed og spredning.

I modsætning til histogrammer estimerer tæthedsplot sandsynligheden for, at en værdi forekommer inden for et interval.

Tæthedsplot-syntaks i ggplot2

I ggplot2 kan et tæthedsplot oprettes med geom_density().

ggplot(data = df, aes(x = variable)) +
  geom_density()

For at sammenligne grupper kan du tilknytte en kategorisk variabel til fill og justere gennemsigtigheden med alpha, så kurverne overlapper tydeligt.

ggplot(data = df, aes(x = variable, fill = group_variable)) +
  geom_density(alpha = 0.5)

Dette gør det nemt at sammenligne, hvordan fordelingen af en numerisk variabel varierer på tværs af kategorier.

Eksempel: Fordeling af salgspriser

Et tæthedsplot giver en glat repræsentation af, hvordan bilpriser er fordelt. I dette eksempel er kurven udfyldt med blå, og akseetiketter præciserer betydningen af værdierne.

ggplot(df, aes(x = selling_price)) +
  geom_density(fill = "blue") +
  labs(title = "Density Plot of Selling Prices",
       x = "Selling Price",
       y = "Density")

Denne visualisering fremhæver, hvor de fleste bilpriser samler sig, samt hvor bredt priserne er fordelt i datasættet. Det er særligt nyttigt til at identificere toppe i fordelingen og sammenligne med andre variabler senere.

question mark

Hvilket argument styrer gennemsigtigheden af overlappende tæthedsplots?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 4
some-alt