Oprettelse af Spredningsdiagrammer
Hvorfor bruge scatter plots?
Et scatter plot er ideelt til at visualisere forholdet mellem variable. Det kan bruges til:
- At vise forhold mellem to numeriske variable;
- At identificere mønstre, klynger eller outliers;
- At undersøge korrelation (positiv/negativ/ingen).
Scatter plot-syntaks i ggplot2
Et scatter plot kan oprettes med geom_point()
. For at gøre dette, skal du angive æstetik for både x
- og y
-aksen.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
For at skelne mellem grupper i dataene kan du tilføje en grupperingsvariabel til color
-æstetikken. Dette tildeler forskellige farver til hver gruppe, hvilket gør det lettere at identificere mønstre.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Eksempel: Salgspris vs. kørte kilometer
Et scatter plot kan bruges til at undersøge, hvordan en bils brug påvirker dens salgspris. I dette eksempel viser x-aksen antallet af kørte kilometer, mens y-aksen viser salgsprisen.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Denne visualisering fremhæver ofte afskrivningstendenser – når kilometertallet stiger, falder salgsprisen typisk. Den kan også afsløre outliers, såsom biler med usædvanligt høje priser trods højt kilometertal.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 4
Oprettelse af Spredningsdiagrammer
Stryg for at vise menuen
Hvorfor bruge scatter plots?
Et scatter plot er ideelt til at visualisere forholdet mellem variable. Det kan bruges til:
- At vise forhold mellem to numeriske variable;
- At identificere mønstre, klynger eller outliers;
- At undersøge korrelation (positiv/negativ/ingen).
Scatter plot-syntaks i ggplot2
Et scatter plot kan oprettes med geom_point()
. For at gøre dette, skal du angive æstetik for både x
- og y
-aksen.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
For at skelne mellem grupper i dataene kan du tilføje en grupperingsvariabel til color
-æstetikken. Dette tildeler forskellige farver til hver gruppe, hvilket gør det lettere at identificere mønstre.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Eksempel: Salgspris vs. kørte kilometer
Et scatter plot kan bruges til at undersøge, hvordan en bils brug påvirker dens salgspris. I dette eksempel viser x-aksen antallet af kørte kilometer, mens y-aksen viser salgsprisen.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Denne visualisering fremhæver ofte afskrivningstendenser – når kilometertallet stiger, falder salgsprisen typisk. Den kan også afsløre outliers, såsom biler med usædvanligt høje priser trods højt kilometertal.
Tak for dine kommentarer!