Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Histogrammen Maken | Datavisualisatie
Data-analyse met R

bookHistogrammen Maken

Waarom histogrammen gebruiken?

Histogrammen worden gebruikt om de verdeling van continue (numerieke) gegevens te visualiseren. Ze tonen hoe gegevens zijn verspreid over intervallen (bins) en helpen bij:

  • Het detecteren van scheefheid, uitschieters of hiaten;
  • Inzicht krijgen in de frequentieverdeling;
  • Snel beoordelen of de gegevens normaal verdeeld zijn of niet.

Ze zijn het meest geschikt voor variabelen zoals prijs, kilometerstand of leeftijd.

Histogram-syntaxis in ggplot2

Een histogram kan worden gemaakt met geom_histogram(), waarbij de x-variabele numeriek moet zijn.

ggplot(data = df, aes(x = variable)) +
  geom_histogram()

Het uiterlijk van het histogram kan worden aangepast met argumenten zoals bins (aantal bins), fill (balkkleur), color (randkleur) en theme voor de opmaak.

Voorbeeld: verdeling van verkoopprijzen

Een histogram kan worden gebruikt om te onderzoeken hoe autoverkoopprijzen zijn verdeeld over de dataset. In dit voorbeeld zijn de balken gevuld met staalblauw en omlijnd in zwart, terwijl labels en een minimalistisch thema zijn toegevoegd voor duidelijkheid.

ggplot(data = df, aes(x = selling_price)) +
  geom_histogram(fill = "steelblue", color = "black") +
  labs(title = "Distribution of Selling Prices",
       x = "Selling Price (in PKR)",
       y = "Count") +
  theme_minimal()

Deze grafiek laat de algemene vorm van de verdeling van de verkoopprijzen zien, waardoor het eenvoudig is te zien of de meeste auto's binnen een bepaald prijsbereik vallen of dat er uitschieters zijn aan de hoge of lage kant.

question mark

Wat bepaalt het argument bins in geom_histogram()?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 3

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Awesome!

Completion rate improved to 4

bookHistogrammen Maken

Veeg om het menu te tonen

Waarom histogrammen gebruiken?

Histogrammen worden gebruikt om de verdeling van continue (numerieke) gegevens te visualiseren. Ze tonen hoe gegevens zijn verspreid over intervallen (bins) en helpen bij:

  • Het detecteren van scheefheid, uitschieters of hiaten;
  • Inzicht krijgen in de frequentieverdeling;
  • Snel beoordelen of de gegevens normaal verdeeld zijn of niet.

Ze zijn het meest geschikt voor variabelen zoals prijs, kilometerstand of leeftijd.

Histogram-syntaxis in ggplot2

Een histogram kan worden gemaakt met geom_histogram(), waarbij de x-variabele numeriek moet zijn.

ggplot(data = df, aes(x = variable)) +
  geom_histogram()

Het uiterlijk van het histogram kan worden aangepast met argumenten zoals bins (aantal bins), fill (balkkleur), color (randkleur) en theme voor de opmaak.

Voorbeeld: verdeling van verkoopprijzen

Een histogram kan worden gebruikt om te onderzoeken hoe autoverkoopprijzen zijn verdeeld over de dataset. In dit voorbeeld zijn de balken gevuld met staalblauw en omlijnd in zwart, terwijl labels en een minimalistisch thema zijn toegevoegd voor duidelijkheid.

ggplot(data = df, aes(x = selling_price)) +
  geom_histogram(fill = "steelblue", color = "black") +
  labs(title = "Distribution of Selling Prices",
       x = "Selling Price (in PKR)",
       y = "Count") +
  theme_minimal()

Deze grafiek laat de algemene vorm van de verdeling van de verkoopprijzen zien, waardoor het eenvoudig is te zien of de meeste auto's binnen een bepaald prijsbereik vallen of dat er uitschieters zijn aan de hoge of lage kant.

question mark

Wat bepaalt het argument bins in geom_histogram()?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 3
some-alt