Lage Tetthetsdiagrammer
Hvorfor bruke tetthetsplott?
Et tetthetsplott er en utjevnet versjon av et histogram. Det er nyttig for å:
- Forstå fordelingen av en numerisk variabel;
- Sammenligne fordelinger på tvers av grupper (for eksempel drivstofftyper);
- Identifisere topper, skjevhet og spredning.
I motsetning til histogrammer estimerer tetthetsplott sannsynligheten for at en verdi forekommer innenfor et område.
Syntaks for tetthetsplott i ggplot2
I ggplot2 kan et tetthetsplott lages med geom_density()
.
ggplot(data = df, aes(x = variable)) +
geom_density()
For å sammenligne grupper kan du tilordne en kategorisk variabel til fill
og justere gjennomsiktigheten med alpha
slik at kurvene overlapper tydelig.
ggplot(data = df, aes(x = variable, fill = group_variable)) +
geom_density(alpha = 0.5)
Dette gjør det enkelt å sammenligne hvordan fordelingen av en numerisk variabel varierer mellom kategorier.
Eksempel: Fordeling av salgspriser
Et tetthetsplott gir en jevn fremstilling av hvordan bilpriser er fordelt. I dette eksemplet er kurven fylt med blått, og aksetitler tydeliggjør betydningen av verdiene.
ggplot(df, aes(x = selling_price)) +
geom_density(fill = "blue") +
labs(title = "Density Plot of Selling Prices",
x = "Selling Price",
y = "Density")
Denne visualiseringen fremhever hvor de fleste bilprisene samler seg, samt hvor bredt prisene er fordelt i datasettet. Den er spesielt nyttig for å identifisere topper i fordelingen og for å sammenligne med andre variabler senere.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 4
Lage Tetthetsdiagrammer
Sveip for å vise menyen
Hvorfor bruke tetthetsplott?
Et tetthetsplott er en utjevnet versjon av et histogram. Det er nyttig for å:
- Forstå fordelingen av en numerisk variabel;
- Sammenligne fordelinger på tvers av grupper (for eksempel drivstofftyper);
- Identifisere topper, skjevhet og spredning.
I motsetning til histogrammer estimerer tetthetsplott sannsynligheten for at en verdi forekommer innenfor et område.
Syntaks for tetthetsplott i ggplot2
I ggplot2 kan et tetthetsplott lages med geom_density()
.
ggplot(data = df, aes(x = variable)) +
geom_density()
For å sammenligne grupper kan du tilordne en kategorisk variabel til fill
og justere gjennomsiktigheten med alpha
slik at kurvene overlapper tydelig.
ggplot(data = df, aes(x = variable, fill = group_variable)) +
geom_density(alpha = 0.5)
Dette gjør det enkelt å sammenligne hvordan fordelingen av en numerisk variabel varierer mellom kategorier.
Eksempel: Fordeling av salgspriser
Et tetthetsplott gir en jevn fremstilling av hvordan bilpriser er fordelt. I dette eksemplet er kurven fylt med blått, og aksetitler tydeliggjør betydningen av verdiene.
ggplot(df, aes(x = selling_price)) +
geom_density(fill = "blue") +
labs(title = "Density Plot of Selling Prices",
x = "Selling Price",
y = "Density")
Denne visualiseringen fremhever hvor de fleste bilprisene samler seg, samt hvor bredt prisene er fordelt i datasettet. Den er spesielt nyttig for å identifisere topper i fordelingen og for å sammenligne med andre variabler senere.
Takk for tilbakemeldingene dine!