Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Spreidingsdiagrammen Maken | Datavisualisatie
Data-analyse met R

bookSpreidingsdiagrammen Maken

Waarom scatterplots gebruiken?

Een scatterplot is ideaal voor het visualiseren van relaties tussen variabelen. Het kan worden gebruikt om:

  • Relaties tussen twee numerieke variabelen weer te geven;
  • Patronen, clusters of uitschieters te detecteren;
  • Correlatie te onderzoeken (positief/negatief/geen).

Scatterplot-syntaxis in ggplot2

Een scatterplot kan worden gemaakt met geom_point(). Hiervoor moeten de esthetische eigenschappen voor zowel de x- als y-as worden gespecificeerd.

ggplot(data = df, aes(x = variable_x, y = variable_y)) +
  geom_point()

Om groepen binnen de data te onderscheiden, kan een groepsvariabele worden toegevoegd aan de color-esthetiek. Hierdoor krijgen verschillende groepen een andere kleur, waardoor patronen beter zichtbaar worden.

ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
  geom_point()

Voorbeeld: Selling Price vs. Kilometers Driven

Een scatterplot kan worden gebruikt om te onderzoeken hoe het gebruik van een auto zich verhoudt tot de verkoopprijs. In dit voorbeeld toont de x-as het aantal kilometers gereden en de y-as de verkoopprijs.

ggplot(df, aes(x = km_driven, y = selling_price)) +
  geom_point() +
  labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
       x = "Kilometers Driven",
       y = "Selling Price")

Deze visualisatie laat vaak afschrijvingstrends zien - naarmate het aantal kilometers toeneemt, daalt de verkoopprijs meestal. Ook kunnen uitschieters zichtbaar worden, zoals auto's met een ongewoon hoge prijs ondanks een hoge kilometerstand.

question mark

Welke ggplot2-functie maakt een spreidingsdiagram?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 5

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Awesome!

Completion rate improved to 4

bookSpreidingsdiagrammen Maken

Veeg om het menu te tonen

Waarom scatterplots gebruiken?

Een scatterplot is ideaal voor het visualiseren van relaties tussen variabelen. Het kan worden gebruikt om:

  • Relaties tussen twee numerieke variabelen weer te geven;
  • Patronen, clusters of uitschieters te detecteren;
  • Correlatie te onderzoeken (positief/negatief/geen).

Scatterplot-syntaxis in ggplot2

Een scatterplot kan worden gemaakt met geom_point(). Hiervoor moeten de esthetische eigenschappen voor zowel de x- als y-as worden gespecificeerd.

ggplot(data = df, aes(x = variable_x, y = variable_y)) +
  geom_point()

Om groepen binnen de data te onderscheiden, kan een groepsvariabele worden toegevoegd aan de color-esthetiek. Hierdoor krijgen verschillende groepen een andere kleur, waardoor patronen beter zichtbaar worden.

ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
  geom_point()

Voorbeeld: Selling Price vs. Kilometers Driven

Een scatterplot kan worden gebruikt om te onderzoeken hoe het gebruik van een auto zich verhoudt tot de verkoopprijs. In dit voorbeeld toont de x-as het aantal kilometers gereden en de y-as de verkoopprijs.

ggplot(df, aes(x = km_driven, y = selling_price)) +
  geom_point() +
  labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
       x = "Kilometers Driven",
       y = "Selling Price")

Deze visualisatie laat vaak afschrijvingstrends zien - naarmate het aantal kilometers toeneemt, daalt de verkoopprijs meestal. Ook kunnen uitschieters zichtbaar worden, zoals auto's met een ongewoon hoge prijs ondanks een hoge kilometerstand.

question mark

Welke ggplot2-functie maakt een spreidingsdiagram?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 5
some-alt