Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Lage Tetthetsdiagrammer | Datavisualisering
Dataanalyse med R

bookLage Tetthetsdiagrammer

Hvorfor bruke tetthetsplott?

Et tetthetsplott er en utjevnet versjon av et histogram. Det er nyttig for å:

  • Forstå fordelingen av en numerisk variabel;
  • Sammenligne fordelinger på tvers av grupper (for eksempel drivstofftyper);
  • Identifisere topper, skjevhet og spredning.

I motsetning til histogrammer estimerer tetthetsplott sannsynligheten for at en verdi forekommer innenfor et område.

Syntaks for tetthetsplott i ggplot2

I ggplot2 kan et tetthetsplott lages med geom_density().

ggplot(data = df, aes(x = variable)) +
  geom_density()

For å sammenligne grupper kan du tilordne en kategorisk variabel til fill og justere gjennomsiktigheten med alpha slik at kurvene overlapper tydelig.

ggplot(data = df, aes(x = variable, fill = group_variable)) +
  geom_density(alpha = 0.5)

Dette gjør det enkelt å sammenligne hvordan fordelingen av en numerisk variabel varierer mellom kategorier.

Eksempel: Fordeling av salgspriser

Et tetthetsplott gir en jevn fremstilling av hvordan bilpriser er fordelt. I dette eksemplet er kurven fylt med blått, og aksetitler tydeliggjør betydningen av verdiene.

ggplot(df, aes(x = selling_price)) +
  geom_density(fill = "blue") +
  labs(title = "Density Plot of Selling Prices",
       x = "Selling Price",
       y = "Density")

Denne visualiseringen fremhever hvor de fleste bilprisene samler seg, samt hvor bredt prisene er fordelt i datasettet. Den er spesielt nyttig for å identifisere topper i fordelingen og for å sammenligne med andre variabler senere.

question mark

Hvilket argument styrer gjennomsiktigheten til overlappende tetthetsgrafer?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 2. Kapittel 4

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Awesome!

Completion rate improved to 4

bookLage Tetthetsdiagrammer

Sveip for å vise menyen

Hvorfor bruke tetthetsplott?

Et tetthetsplott er en utjevnet versjon av et histogram. Det er nyttig for å:

  • Forstå fordelingen av en numerisk variabel;
  • Sammenligne fordelinger på tvers av grupper (for eksempel drivstofftyper);
  • Identifisere topper, skjevhet og spredning.

I motsetning til histogrammer estimerer tetthetsplott sannsynligheten for at en verdi forekommer innenfor et område.

Syntaks for tetthetsplott i ggplot2

I ggplot2 kan et tetthetsplott lages med geom_density().

ggplot(data = df, aes(x = variable)) +
  geom_density()

For å sammenligne grupper kan du tilordne en kategorisk variabel til fill og justere gjennomsiktigheten med alpha slik at kurvene overlapper tydelig.

ggplot(data = df, aes(x = variable, fill = group_variable)) +
  geom_density(alpha = 0.5)

Dette gjør det enkelt å sammenligne hvordan fordelingen av en numerisk variabel varierer mellom kategorier.

Eksempel: Fordeling av salgspriser

Et tetthetsplott gir en jevn fremstilling av hvordan bilpriser er fordelt. I dette eksemplet er kurven fylt med blått, og aksetitler tydeliggjør betydningen av verdiene.

ggplot(df, aes(x = selling_price)) +
  geom_density(fill = "blue") +
  labs(title = "Density Plot of Selling Prices",
       x = "Selling Price",
       y = "Density")

Denne visualiseringen fremhever hvor de fleste bilprisene samler seg, samt hvor bredt prisene er fordelt i datasettet. Den er spesielt nyttig for å identifisere topper i fordelingen og for å sammenligne med andre variabler senere.

question mark

Hvilket argument styrer gjennomsiktigheten til overlappende tetthetsgrafer?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 2. Kapittel 4
some-alt