Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Oprettelse af Spredningsdiagrammer | Datavisualisering
Dataanalyse med R

bookOprettelse af Spredningsdiagrammer

Hvorfor bruge scatter plots?

Et scatter plot er ideelt til at visualisere relationer mellem variable. Det kan bruges til:

  • At vise relationer mellem to numeriske variable;
  • At identificere mønstre, klynger eller outliers;
  • At undersøge korrelation (positiv/negativ/ingen).

Scatter plot syntaks i ggplot2

Du kan oprette et scatter plot med geom_point(). For at gøre dette, skal du angive æstetik for både x- og y-akserne.

ggplot(data = df, aes(x = variable_x, y = variable_y)) +
  geom_point()

For at skelne mellem grupper i dataene kan du tilføje en grupperingsvariabel til color-æstetikken. Dette tildeler forskellige farver til hver gruppe, hvilket gør mønstre lettere at identificere.

ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
  geom_point()

Eksempel: Selling Price vs. Kilometers Driven

Et scatter plot kan bruges til at undersøge, hvordan en bils brug påvirker dens salgspris. I dette eksempel viser x-aksen antallet af kørte kilometer, mens y-aksen viser salgsprisen.

ggplot(df, aes(x = km_driven, y = selling_price)) +
  geom_point() +
  labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
       x = "Kilometers Driven",
       y = "Selling Price")

Denne visualisering fremhæver ofte afskrivningstendenser – når kilometertallet stiger, falder salgsprisen typisk. Den kan også afsløre outliers, såsom biler med usædvanligt høje priser trods højt kilometertal.

question mark

Hvilken ggplot2-funktion opretter et scatter plot?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 5

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain how to interpret a scatter plot?

What does a negative correlation look like on a scatter plot?

How can I identify outliers using a scatter plot?

Awesome!

Completion rate improved to 4

bookOprettelse af Spredningsdiagrammer

Stryg for at vise menuen

Hvorfor bruge scatter plots?

Et scatter plot er ideelt til at visualisere relationer mellem variable. Det kan bruges til:

  • At vise relationer mellem to numeriske variable;
  • At identificere mønstre, klynger eller outliers;
  • At undersøge korrelation (positiv/negativ/ingen).

Scatter plot syntaks i ggplot2

Du kan oprette et scatter plot med geom_point(). For at gøre dette, skal du angive æstetik for både x- og y-akserne.

ggplot(data = df, aes(x = variable_x, y = variable_y)) +
  geom_point()

For at skelne mellem grupper i dataene kan du tilføje en grupperingsvariabel til color-æstetikken. Dette tildeler forskellige farver til hver gruppe, hvilket gør mønstre lettere at identificere.

ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
  geom_point()

Eksempel: Selling Price vs. Kilometers Driven

Et scatter plot kan bruges til at undersøge, hvordan en bils brug påvirker dens salgspris. I dette eksempel viser x-aksen antallet af kørte kilometer, mens y-aksen viser salgsprisen.

ggplot(df, aes(x = km_driven, y = selling_price)) +
  geom_point() +
  labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
       x = "Kilometers Driven",
       y = "Selling Price")

Denne visualisering fremhæver ofte afskrivningstendenser – når kilometertallet stiger, falder salgsprisen typisk. Den kan også afsløre outliers, såsom biler med usædvanligt høje priser trods højt kilometertal.

question mark

Hvilken ggplot2-funktion opretter et scatter plot?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 5
some-alt