Histogrammen Maken
Waarom histogrammen gebruiken?
Histogrammen worden gebruikt om de verdeling van continue (numerieke) gegevens te visualiseren. Ze tonen hoe gegevens zijn verspreid over intervallen (bins) en helpen bij:
- Het detecteren van scheefheid, uitschieters of hiaten;
- Inzicht krijgen in de frequentieverdeling;
- Snel beoordelen of de gegevens normaal verdeeld zijn of niet.
Ze zijn het meest geschikt voor variabelen zoals prijs, kilometerstand of leeftijd.
Histogram-syntaxis in ggplot2
Een histogram kan worden gemaakt met geom_histogram()
, waarbij de x
-variabele numeriek moet zijn.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
Het uiterlijk van het histogram kan worden aangepast met argumenten zoals bins
(aantal bins), fill
(balkkleur), color
(randkleur) en theme
voor de opmaak.
Voorbeeld: verdeling van verkoopprijzen
Een histogram kan worden gebruikt om te onderzoeken hoe autoverkoopprijzen zijn verdeeld over de dataset. In dit voorbeeld zijn de balken gevuld met staalblauw en omlijnd in zwart, terwijl labels en een minimalistisch thema zijn toegevoegd voor duidelijkheid.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Deze grafiek laat de algemene vorm van de verdeling van de verkoopprijzen zien, waardoor het eenvoudig is te zien of de meeste auto's binnen een bepaald prijsbereik vallen of dat er uitschieters zijn aan de hoge of lage kant.
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 4
Histogrammen Maken
Veeg om het menu te tonen
Waarom histogrammen gebruiken?
Histogrammen worden gebruikt om de verdeling van continue (numerieke) gegevens te visualiseren. Ze tonen hoe gegevens zijn verspreid over intervallen (bins) en helpen bij:
- Het detecteren van scheefheid, uitschieters of hiaten;
- Inzicht krijgen in de frequentieverdeling;
- Snel beoordelen of de gegevens normaal verdeeld zijn of niet.
Ze zijn het meest geschikt voor variabelen zoals prijs, kilometerstand of leeftijd.
Histogram-syntaxis in ggplot2
Een histogram kan worden gemaakt met geom_histogram()
, waarbij de x
-variabele numeriek moet zijn.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
Het uiterlijk van het histogram kan worden aangepast met argumenten zoals bins
(aantal bins), fill
(balkkleur), color
(randkleur) en theme
voor de opmaak.
Voorbeeld: verdeling van verkoopprijzen
Een histogram kan worden gebruikt om te onderzoeken hoe autoverkoopprijzen zijn verdeeld over de dataset. In dit voorbeeld zijn de balken gevuld met staalblauw en omlijnd in zwart, terwijl labels en een minimalistisch thema zijn toegevoegd voor duidelijkheid.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Deze grafiek laat de algemene vorm van de verdeling van de verkoopprijzen zien, waardoor het eenvoudig is te zien of de meeste auto's binnen een bepaald prijsbereik vallen of dat er uitschieters zijn aan de hoge of lage kant.
Bedankt voor je feedback!