Oprettelse af Spredningsdiagrammer
Hvorfor bruge scatter plots?
Et scatter plot er ideelt til at visualisere relationer mellem variable. Det kan bruges til:
- At vise relationer mellem to numeriske variable;
- At identificere mønstre, klynger eller outliers;
- At undersøge korrelation (positiv/negativ/ingen).
Scatter plot syntaks i ggplot2
Du kan oprette et scatter plot med geom_point()
. For at gøre dette, skal du angive æstetik for både x
- og y
-akserne.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
For at skelne mellem grupper i dataene kan du tilføje en grupperingsvariabel til color
-æstetikken. Dette tildeler forskellige farver til hver gruppe, hvilket gør mønstre lettere at identificere.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Eksempel: Selling Price vs. Kilometers Driven
Et scatter plot kan bruges til at undersøge, hvordan en bils brug påvirker dens salgspris. I dette eksempel viser x-aksen antallet af kørte kilometer, mens y-aksen viser salgsprisen.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Denne visualisering fremhæver ofte afskrivningstendenser – når kilometertallet stiger, falder salgsprisen typisk. Den kan også afsløre outliers, såsom biler med usædvanligt høje priser trods højt kilometertal.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Can you explain how to interpret a scatter plot?
What does a negative correlation look like on a scatter plot?
How can I identify outliers using a scatter plot?
Awesome!
Completion rate improved to 4
Oprettelse af Spredningsdiagrammer
Stryg for at vise menuen
Hvorfor bruge scatter plots?
Et scatter plot er ideelt til at visualisere relationer mellem variable. Det kan bruges til:
- At vise relationer mellem to numeriske variable;
- At identificere mønstre, klynger eller outliers;
- At undersøge korrelation (positiv/negativ/ingen).
Scatter plot syntaks i ggplot2
Du kan oprette et scatter plot med geom_point()
. For at gøre dette, skal du angive æstetik for både x
- og y
-akserne.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
For at skelne mellem grupper i dataene kan du tilføje en grupperingsvariabel til color
-æstetikken. Dette tildeler forskellige farver til hver gruppe, hvilket gør mønstre lettere at identificere.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Eksempel: Selling Price vs. Kilometers Driven
Et scatter plot kan bruges til at undersøge, hvordan en bils brug påvirker dens salgspris. I dette eksempel viser x-aksen antallet af kørte kilometer, mens y-aksen viser salgsprisen.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Denne visualisering fremhæver ofte afskrivningstendenser – når kilometertallet stiger, falder salgsprisen typisk. Den kan også afsløre outliers, såsom biler med usædvanligt høje priser trods højt kilometertal.
Tak for dine kommentarer!