Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Oprettelse af Histogrammer | Datavisualisering
Dataanalyse med R

bookOprettelse af Histogrammer

Hvorfor bruge histogrammer?

Histogrammer anvendes til at visualisere fordelingen af kontinuerlige (numeriske) data. De viser, hvordan data er fordelt på intervaller (bins) og hjælper med at:

  • Identificere skævhed, outliers eller huller;
  • Forstå frekvensfordeling;
  • Hurtigt vurdere, om dataene er normalfordelte eller ej.

De egner sig bedst til variable som pris, kilometertal eller alder.

Histogram-syntaks i ggplot2

Et histogram kan oprettes med geom_histogram(), hvor variablen x skal være numerisk.

ggplot(data = df, aes(x = variable)) +
  geom_histogram()

Udseendet af histogrammet kan tilpasses med argumenter som bins (antal bins), fill (søjlens farve), color (kantfarve) og theme til styling.

Eksempel: Fordeling af salgspriser

Et histogram kan bruges til at undersøge, hvordan bilpriser er fordelt i datasættet. I dette eksempel er søjlerne udfyldt med stålblå og omkranset med sort, mens etiketter og et minimalt tema tilføjes for tydelighed.

ggplot(data = df, aes(x = selling_price)) +
  geom_histogram(fill = "steelblue", color = "black") +
  labs(title = "Distribution of Selling Prices",
       x = "Selling Price (in PKR)",
       y = "Count") +
  theme_minimal()

Dette plot viser den overordnede form på fordelingen af salgspriser, hvilket gør det nemt at se, om de fleste biler ligger inden for et bestemt prisinterval, eller om der er outliers i den høje eller lave ende.

question mark

Hvad styrer argumentet bins i geom_histogram()?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 3

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain the difference between a histogram and a bar plot?

How do I choose the right number of bins for my histogram?

What does it mean if my histogram is skewed to the right or left?

Awesome!

Completion rate improved to 4

bookOprettelse af Histogrammer

Stryg for at vise menuen

Hvorfor bruge histogrammer?

Histogrammer anvendes til at visualisere fordelingen af kontinuerlige (numeriske) data. De viser, hvordan data er fordelt på intervaller (bins) og hjælper med at:

  • Identificere skævhed, outliers eller huller;
  • Forstå frekvensfordeling;
  • Hurtigt vurdere, om dataene er normalfordelte eller ej.

De egner sig bedst til variable som pris, kilometertal eller alder.

Histogram-syntaks i ggplot2

Et histogram kan oprettes med geom_histogram(), hvor variablen x skal være numerisk.

ggplot(data = df, aes(x = variable)) +
  geom_histogram()

Udseendet af histogrammet kan tilpasses med argumenter som bins (antal bins), fill (søjlens farve), color (kantfarve) og theme til styling.

Eksempel: Fordeling af salgspriser

Et histogram kan bruges til at undersøge, hvordan bilpriser er fordelt i datasættet. I dette eksempel er søjlerne udfyldt med stålblå og omkranset med sort, mens etiketter og et minimalt tema tilføjes for tydelighed.

ggplot(data = df, aes(x = selling_price)) +
  geom_histogram(fill = "steelblue", color = "black") +
  labs(title = "Distribution of Selling Prices",
       x = "Selling Price (in PKR)",
       y = "Count") +
  theme_minimal()

Dette plot viser den overordnede form på fordelingen af salgspriser, hvilket gør det nemt at se, om de fleste biler ligger inden for et bestemt prisinterval, eller om der er outliers i den høje eller lave ende.

question mark

Hvad styrer argumentet bins i geom_histogram()?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 3
some-alt