Oprettelse af Tæthedsdiagrammer
Hvorfor bruge tæthedsplot?
Et tæthedsplot er en udglattet version af et histogram. Det er nyttigt til at:
- Forstå fordelingen af en numerisk variabel;
- Sammenligne fordelinger på tværs af grupper (som brændstoftyper);
- Identificere toppe, skævhed og spredning.
I modsætning til histogrammer estimerer tæthedsplot sandsynligheden for, at en værdi forekommer inden for et interval.
Tæthedsplot-syntaks i ggplot2
I ggplot2 kan et tæthedsplot oprettes med geom_density()
.
ggplot(data = df, aes(x = variable)) +
geom_density()
For at sammenligne grupper kan du tilknytte en kategorisk variabel til fill
og justere gennemsigtigheden med alpha
, så kurverne overlapper tydeligt.
ggplot(data = df, aes(x = variable, fill = group_variable)) +
geom_density(alpha = 0.5)
Dette gør det nemt at sammenligne, hvordan fordelingen af en numerisk variabel varierer på tværs af kategorier.
Eksempel: Fordeling af salgspriser
Et tæthedsplot giver en glat repræsentation af, hvordan bilpriser er fordelt. I dette eksempel er kurven udfyldt med blå, og akseetiketter præciserer betydningen af værdierne.
ggplot(df, aes(x = selling_price)) +
geom_density(fill = "blue") +
labs(title = "Density Plot of Selling Prices",
x = "Selling Price",
y = "Density")
Denne visualisering fremhæver, hvor de fleste bilpriser samler sig, samt hvor bredt priserne er fordelt i datasættet. Det er særligt nyttigt til at identificere toppe i fordelingen og sammenligne med andre variabler senere.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
What is the difference between a density plot and a histogram?
How do I interpret the peaks and tails in a density plot?
Can you explain how to compare distributions using density plots?
Awesome!
Completion rate improved to 4
Oprettelse af Tæthedsdiagrammer
Stryg for at vise menuen
Hvorfor bruge tæthedsplot?
Et tæthedsplot er en udglattet version af et histogram. Det er nyttigt til at:
- Forstå fordelingen af en numerisk variabel;
- Sammenligne fordelinger på tværs af grupper (som brændstoftyper);
- Identificere toppe, skævhed og spredning.
I modsætning til histogrammer estimerer tæthedsplot sandsynligheden for, at en værdi forekommer inden for et interval.
Tæthedsplot-syntaks i ggplot2
I ggplot2 kan et tæthedsplot oprettes med geom_density()
.
ggplot(data = df, aes(x = variable)) +
geom_density()
For at sammenligne grupper kan du tilknytte en kategorisk variabel til fill
og justere gennemsigtigheden med alpha
, så kurverne overlapper tydeligt.
ggplot(data = df, aes(x = variable, fill = group_variable)) +
geom_density(alpha = 0.5)
Dette gør det nemt at sammenligne, hvordan fordelingen af en numerisk variabel varierer på tværs af kategorier.
Eksempel: Fordeling af salgspriser
Et tæthedsplot giver en glat repræsentation af, hvordan bilpriser er fordelt. I dette eksempel er kurven udfyldt med blå, og akseetiketter præciserer betydningen af værdierne.
ggplot(df, aes(x = selling_price)) +
geom_density(fill = "blue") +
labs(title = "Density Plot of Selling Prices",
x = "Selling Price",
y = "Density")
Denne visualisering fremhæver, hvor de fleste bilpriser samler sig, samt hvor bredt priserne er fordelt i datasættet. Det er særligt nyttigt til at identificere toppe i fordelingen og sammenligne med andre variabler senere.
Tak for dine kommentarer!