Summary  
This chapter covers creating scatter plots using ggplot2’s geom_point by mapping numeric variables to the x and y aesthetics and adding a grouping variable via color to highlight patterns, correlations, and outliers.

General domain of usage  
Automotive sales data analysis

## Hvorfor bruke spredningsdiagrammer?
Et **spredningsdiagram** er ideelt for å visualisere **sammenhenger mellom variabler**. Det kan brukes til å:
- Vise **forhold** mellom to numeriske variabler;
- Oppdage mønstre, klynger eller avvik;
- Utforske **korrelasjon** (positiv/negativ/ingen).

## Syntaks for spredningsdiagram i ggplot2
Du kan lage et spredningsdiagram med `geom_point()`. For å gjøre dette, spesifiserer du estetikk for både `x`- og `y`-aksene.

```
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
  geom_point()
```

For å skille grupper i datasettet, kan du legge til en grupperingsvariabel i `color`-estetikken. Dette gir ulike farger til hver gruppe, noe som gjør det lettere å se mønstre.

```
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
  geom_point()
```

## Eksempel: Salgspris vs. kjørte kilometer
Et spredningsdiagram kan brukes til å undersøke hvordan en bils bruk henger sammen med salgsprisen. I dette eksempelet viser x-aksen antall kjørte kilometer, mens y-aksen viser salgsprisen.

```
ggplot(df, aes(x = km_driven, y = selling_price)) +
  geom_point() +
  labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
       x = "Kilometers Driven",
       y = "Selling Price")
```

Denne visualiseringen fremhever ofte avskrivningstrender – når kjørelengden øker, synker vanligvis salgsprisen. Den kan også avdekke avvik, som biler med uvanlig høy pris til tross for høy kjørelengde.

Last ned datasett

Last ned kapittelkode

Hvilken `ggplot2`-funksjon lager et spredningsdiagram?


Få praktisk erfaring med dataanalyse i R ved å lære hvordan du rengjør, transformerer og visualiserer datasett. Utforsk essensielle arbeidsflyter som utvalg og filtrering av data, håndtering av manglende verdier og oppsummering av resultater. Bygg selvtillit i å forberede data for innsikt, rapportering og dypere statistisk utforskning.

Utforsk grunnleggende prinsipper for dataanalyse med R. Lær hvordan du installerer verktøyene, laster inn og inspiserer datasett, velger og filtrerer informasjon, sorterer og transformerer data, håndterer manglende verdier og oppsummerer resultater for dypere innsikt.

Lær å lage overbevisende visualiseringer med ggplot2. Bygg stolpediagrammer, histogrammer, tetthetsplott og spredningsplott, og tilpass og forbedre dem med stilvalg og fasettering for å avdekke dypere innsikt i dataene dine.

Styrk din forståelse av statistikk for dataanalyse. Bruk beskrivende mål, identifiser og håndter uteliggere, og anvend korrelasjonsteknikker med visuelle verktøy som varmekart og spredningsdiagrammer for å avdekke meningsfulle sammenhenger.

Lage Spredningsdiagrammer

Hvorfor bruke spredningsdiagrammer?

Syntaks for spredningsdiagram i ggplot2

Eksempel: Salgspris vs. kjørte kilometer