Spreidingsdiagrammen Maken
Veeg om het menu te tonen
Waarom scatterplots gebruiken?
Een scatterplot is ideaal voor het visualiseren van relaties tussen variabelen. Het kan worden gebruikt om:
- Relaties tussen twee numerieke variabelen weer te geven;
- Patronen, clusters of uitschieters te detecteren;
- Correlatie (positief/negatief/geen) te onderzoeken.
Scatterplot-syntaxis in ggplot2
Een scatterplot kan worden gemaakt met geom_point(). Hiervoor moeten de esthetieken voor zowel de x- als de y-as worden opgegeven.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
Om groepen binnen de data te onderscheiden, kan een groepsvariabele aan de color-esthetiek worden toegevoegd. Hierdoor krijgen de groepen verschillende kleuren, waardoor patronen beter zichtbaar worden.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Voorbeeld: Verkoopprijs versus gereden kilometers
Een scatterplot kan worden gebruikt om te onderzoeken hoe het gebruik van een auto samenhangt met de verkoopprijs. In dit voorbeeld toont de x-as het aantal gereden kilometers en de y-as de verkoopprijs.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Deze visualisatie laat vaak afschrijvingstrends zien – naarmate het aantal kilometers toeneemt, daalt de verkoopprijs meestal. Ook kunnen uitschieters zichtbaar worden, zoals auto's met een ongewoon hoge prijs ondanks een hoge kilometerstand.
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.