Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Dichtheidsplots Maken | Datavisualisatie
Data-analyse met R

bookDichtheidsplots Maken

Waarom dichtheidsplots gebruiken?

Een dichtheidsplot is een vloeiendere versie van een histogram. Het is nuttig om:

  • Inzicht te krijgen in de verdeling van een numerieke variabele;
  • Verdelingen te vergelijken tussen groepen (zoals brandstoftypen);
  • Piekpunten, scheefheid en spreiding te signaleren.

In tegenstelling tot histogrammen schatten dichtheidsplots de kans dat een waarde binnen een bepaald bereik voorkomt.

Dichtheidsplot-syntaxis in ggplot2

In ggplot2 kan een dichtheidsplot worden gemaakt met geom_density().

ggplot(data = df, aes(x = variable)) +
  geom_density()

Om groepen te vergelijken, kan een categorische variabele aan fill worden gekoppeld en kan de transparantie met alpha worden aangepast zodat de curves duidelijk overlappen.

ggplot(data = df, aes(x = variable, fill = group_variable)) +
  geom_density(alpha = 0.5)

Hierdoor wordt het eenvoudig om te vergelijken hoe de verdeling van een numerieke variabele verschilt tussen categorieën.

Voorbeeld: Verdeling van verkoopprijzen

Een dichtheidsplot geeft een vloeiende weergave van hoe autoprijzen zijn verdeeld. In dit voorbeeld is de curve blauw ingevuld en verduidelijken de aslabels de betekenis van de waarden.

ggplot(df, aes(x = selling_price)) +
  geom_density(fill = "blue") +
  labs(title = "Density Plot of Selling Prices",
       x = "Selling Price",
       y = "Density")

Deze visualisatie laat zien waar de meeste autoprijzen zich concentreren en hoe breed de prijzen in de dataset zijn verspreid. Het is vooral nuttig om pieken in de verdeling te identificeren en later te vergelijken met andere variabelen.

question mark

Welk argument bepaalt de transparantie van overlappende dichtheidsplots?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 4

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Suggested prompts:

What is the difference between a density plot and a histogram?

How do I interpret the peaks and tails in a density plot?

Can you explain how to compare distributions using density plots?

Awesome!

Completion rate improved to 4

bookDichtheidsplots Maken

Veeg om het menu te tonen

Waarom dichtheidsplots gebruiken?

Een dichtheidsplot is een vloeiendere versie van een histogram. Het is nuttig om:

  • Inzicht te krijgen in de verdeling van een numerieke variabele;
  • Verdelingen te vergelijken tussen groepen (zoals brandstoftypen);
  • Piekpunten, scheefheid en spreiding te signaleren.

In tegenstelling tot histogrammen schatten dichtheidsplots de kans dat een waarde binnen een bepaald bereik voorkomt.

Dichtheidsplot-syntaxis in ggplot2

In ggplot2 kan een dichtheidsplot worden gemaakt met geom_density().

ggplot(data = df, aes(x = variable)) +
  geom_density()

Om groepen te vergelijken, kan een categorische variabele aan fill worden gekoppeld en kan de transparantie met alpha worden aangepast zodat de curves duidelijk overlappen.

ggplot(data = df, aes(x = variable, fill = group_variable)) +
  geom_density(alpha = 0.5)

Hierdoor wordt het eenvoudig om te vergelijken hoe de verdeling van een numerieke variabele verschilt tussen categorieën.

Voorbeeld: Verdeling van verkoopprijzen

Een dichtheidsplot geeft een vloeiende weergave van hoe autoprijzen zijn verdeeld. In dit voorbeeld is de curve blauw ingevuld en verduidelijken de aslabels de betekenis van de waarden.

ggplot(df, aes(x = selling_price)) +
  geom_density(fill = "blue") +
  labs(title = "Density Plot of Selling Prices",
       x = "Selling Price",
       y = "Density")

Deze visualisatie laat zien waar de meeste autoprijzen zich concentreren en hoe breed de prijzen in de dataset zijn verspreid. Het is vooral nuttig om pieken in de verdeling te identificeren en later te vergelijken met andere variabelen.

question mark

Welk argument bepaalt de transparantie van overlappende dichtheidsplots?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 4
some-alt