Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Lage Spredningsdiagrammer | Datavisualisering
Dataanalyse med R

bookLage Spredningsdiagrammer

Hvorfor bruke spredningsdiagrammer?

Et spredningsdiagram er ideelt for å visualisere forholdet mellom variabler. Det kan brukes til å:

  • Vise forhold mellom to numeriske variabler;
  • Avdekke mønstre, klynger eller avvik;
  • Utforske korrelasjon (positiv/negativ/ingen).

Syntaks for spredningsdiagram i ggplot2

Du kan lage et spredningsdiagram med geom_point(). For å gjøre dette, spesifiserer du estetikk for både x- og y-aksene.

ggplot(data = df, aes(x = variable_x, y = variable_y)) +
  geom_point()

For å skille grupper i datasettet, kan du legge til en grupperingsvariabel i color-estetikken. Dette gir ulike farger til hver gruppe, noe som gjør det lettere å se mønstre.

ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
  geom_point()

Eksempel: Salgspris vs. kjørte kilometer

Et spredningsdiagram kan brukes til å undersøke hvordan en bils bruk henger sammen med salgsprisen. I dette eksempelet viser x-aksen antall kjørte kilometer, mens y-aksen viser salgsprisen.

ggplot(df, aes(x = km_driven, y = selling_price)) +
  geom_point() +
  labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
       x = "Kilometers Driven",
       y = "Selling Price")

Denne visualiseringen fremhever ofte avskrivningstrender – når kjørelengden øker, synker vanligvis salgsprisen. Den kan også avdekke avvik, for eksempel biler med uvanlig høy pris til tross for høy kjørelengde.

question mark

Hvilken ggplot2-funksjon lager et spredningsdiagram?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 2. Kapittel 5

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Suggested prompts:

Can you explain how to interpret a scatter plot?

What does a negative correlation look like on a scatter plot?

How can I identify outliers using a scatter plot?

Awesome!

Completion rate improved to 4

bookLage Spredningsdiagrammer

Sveip for å vise menyen

Hvorfor bruke spredningsdiagrammer?

Et spredningsdiagram er ideelt for å visualisere forholdet mellom variabler. Det kan brukes til å:

  • Vise forhold mellom to numeriske variabler;
  • Avdekke mønstre, klynger eller avvik;
  • Utforske korrelasjon (positiv/negativ/ingen).

Syntaks for spredningsdiagram i ggplot2

Du kan lage et spredningsdiagram med geom_point(). For å gjøre dette, spesifiserer du estetikk for både x- og y-aksene.

ggplot(data = df, aes(x = variable_x, y = variable_y)) +
  geom_point()

For å skille grupper i datasettet, kan du legge til en grupperingsvariabel i color-estetikken. Dette gir ulike farger til hver gruppe, noe som gjør det lettere å se mønstre.

ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
  geom_point()

Eksempel: Salgspris vs. kjørte kilometer

Et spredningsdiagram kan brukes til å undersøke hvordan en bils bruk henger sammen med salgsprisen. I dette eksempelet viser x-aksen antall kjørte kilometer, mens y-aksen viser salgsprisen.

ggplot(df, aes(x = km_driven, y = selling_price)) +
  geom_point() +
  labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
       x = "Kilometers Driven",
       y = "Selling Price")

Denne visualiseringen fremhever ofte avskrivningstrender – når kjørelengden øker, synker vanligvis salgsprisen. Den kan også avdekke avvik, for eksempel biler med uvanlig høy pris til tross for høy kjørelengde.

question mark

Hvilken ggplot2-funksjon lager et spredningsdiagram?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 2. Kapittel 5
some-alt