Spreidingsdiagrammen Maken
Waarom scatterplots gebruiken?
Een scatterplot is ideaal voor het visualiseren van relaties tussen variabelen. Het kan worden gebruikt om:
- Relaties tussen twee numerieke variabelen weer te geven;
- Patronen, clusters of uitschieters te detecteren;
- Correlatie (positief/negatief/geen) te onderzoeken.
Scatterplot-syntaxis in ggplot2
Een scatterplot kan worden gemaakt met geom_point()
. Specificeer hiervoor de esthetiek voor zowel de x
- als de y
-as.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
Om groepen binnen de data te onderscheiden, kan een groepsvariabele worden toegevoegd aan de color
-esthetiek. Hierdoor krijgen de verschillende groepen een andere kleur, waardoor patronen beter zichtbaar worden.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Voorbeeld: Verkoopprijs vs. gereden kilometers
Een scatterplot kan worden gebruikt om te onderzoeken hoe het gebruik van een auto zich verhoudt tot de verkoopprijs. In dit voorbeeld toont de x-as het aantal gereden kilometers, terwijl de y-as de verkoopprijs weergeeft.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Deze visualisatie laat vaak afschrijvingstrends zien – naarmate het aantal kilometers toeneemt, daalt de verkoopprijs doorgaans. Ook kunnen uitschieters zichtbaar worden, zoals auto's met een ongewoon hoge prijs ondanks een hoge kilometerstand.
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Can you explain how to interpret a scatter plot?
What does a negative correlation look like on a scatter plot?
How can I identify outliers using a scatter plot?
Awesome!
Completion rate improved to 4
Spreidingsdiagrammen Maken
Veeg om het menu te tonen
Waarom scatterplots gebruiken?
Een scatterplot is ideaal voor het visualiseren van relaties tussen variabelen. Het kan worden gebruikt om:
- Relaties tussen twee numerieke variabelen weer te geven;
- Patronen, clusters of uitschieters te detecteren;
- Correlatie (positief/negatief/geen) te onderzoeken.
Scatterplot-syntaxis in ggplot2
Een scatterplot kan worden gemaakt met geom_point()
. Specificeer hiervoor de esthetiek voor zowel de x
- als de y
-as.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
Om groepen binnen de data te onderscheiden, kan een groepsvariabele worden toegevoegd aan de color
-esthetiek. Hierdoor krijgen de verschillende groepen een andere kleur, waardoor patronen beter zichtbaar worden.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Voorbeeld: Verkoopprijs vs. gereden kilometers
Een scatterplot kan worden gebruikt om te onderzoeken hoe het gebruik van een auto zich verhoudt tot de verkoopprijs. In dit voorbeeld toont de x-as het aantal gereden kilometers, terwijl de y-as de verkoopprijs weergeeft.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Deze visualisatie laat vaak afschrijvingstrends zien – naarmate het aantal kilometers toeneemt, daalt de verkoopprijs doorgaans. Ook kunnen uitschieters zichtbaar worden, zoals auto's met een ongewoon hoge prijs ondanks een hoge kilometerstand.
Bedankt voor je feedback!