Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Oprettelse af Histogrammer | Datavisualisering
Dataanalyse med R

bookOprettelse af Histogrammer

Hvorfor bruge histogrammer?

Histogrammer bruges til at visualisere fordelingen af kontinuerlige (numeriske) data. De viser, hvordan data er fordelt på intervaller (bins) og hjælper med at:

  • Identificere skævhed, outliers eller huller;
  • Forstå frekvensfordeling;
  • Hurtigt vurdere, om dataene er normalfordelte eller ej.

De egner sig bedst til variable som pris, kilometertal eller alder.

Histogram-syntaks i ggplot2

Du kan oprette et histogram ved hjælp af geom_histogram(), hvor x-variablen skal være numerisk.

ggplot(data = df, aes(x = variable)) +
  geom_histogram()

Udseendet af histogrammet kan tilpasses med argumenter som bins (antal bins), fill (søjlens farve), color (kantfarve) og theme til styling.

Eksempel: Fordeling af salgspriser

Et histogram kan bruges til at undersøge, hvordan bilpriser er fordelt i datasættet. I dette eksempel er søjlerne udfyldt med steel blue og omkranset med sort, mens etiketter og et minimalt tema tilføjes for tydelighed.

ggplot(data = df, aes(x = selling_price)) +
  geom_histogram(fill = "steelblue", color = "black") +
  labs(title = "Distribution of Selling Prices",
       x = "Selling Price (in PKR)",
       y = "Count") +
  theme_minimal()

Dette plot viser den overordnede form på fordelingen af salgspriser, hvilket gør det nemt at se, om de fleste biler ligger inden for et bestemt prisinterval, eller om der er outliers i den høje eller lave ende.

question mark

Hvad styrer argumentet bins i geom_histogram()?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 3

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Awesome!

Completion rate improved to 4

bookOprettelse af Histogrammer

Stryg for at vise menuen

Hvorfor bruge histogrammer?

Histogrammer bruges til at visualisere fordelingen af kontinuerlige (numeriske) data. De viser, hvordan data er fordelt på intervaller (bins) og hjælper med at:

  • Identificere skævhed, outliers eller huller;
  • Forstå frekvensfordeling;
  • Hurtigt vurdere, om dataene er normalfordelte eller ej.

De egner sig bedst til variable som pris, kilometertal eller alder.

Histogram-syntaks i ggplot2

Du kan oprette et histogram ved hjælp af geom_histogram(), hvor x-variablen skal være numerisk.

ggplot(data = df, aes(x = variable)) +
  geom_histogram()

Udseendet af histogrammet kan tilpasses med argumenter som bins (antal bins), fill (søjlens farve), color (kantfarve) og theme til styling.

Eksempel: Fordeling af salgspriser

Et histogram kan bruges til at undersøge, hvordan bilpriser er fordelt i datasættet. I dette eksempel er søjlerne udfyldt med steel blue og omkranset med sort, mens etiketter og et minimalt tema tilføjes for tydelighed.

ggplot(data = df, aes(x = selling_price)) +
  geom_histogram(fill = "steelblue", color = "black") +
  labs(title = "Distribution of Selling Prices",
       x = "Selling Price (in PKR)",
       y = "Count") +
  theme_minimal()

Dette plot viser den overordnede form på fordelingen af salgspriser, hvilket gør det nemt at se, om de fleste biler ligger inden for et bestemt prisinterval, eller om der er outliers i den høje eller lave ende.

question mark

Hvad styrer argumentet bins i geom_histogram()?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 3
some-alt