Oprettelse af Histogrammer
Hvorfor bruge histogrammer?
Histogrammer anvendes til at visualisere fordelingen af kontinuerlige (numeriske) data. De viser, hvordan data er fordelt på intervaller (bins) og hjælper med at:
- Identificere skævhed, outliers eller huller;
- Forstå frekvensfordeling;
- Hurtigt vurdere, om dataene er normalfordelte eller ej.
De egner sig bedst til variable som pris, kilometertal eller alder.
Histogram-syntaks i ggplot2
Et histogram kan oprettes med geom_histogram()
, hvor variablen x
skal være numerisk.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
Udseendet af histogrammet kan tilpasses med argumenter som bins
(antal bins), fill
(søjlens farve), color
(kantfarve) og theme
til styling.
Eksempel: Fordeling af salgspriser
Et histogram kan bruges til at undersøge, hvordan bilpriser er fordelt i datasættet. I dette eksempel er søjlerne udfyldt med stålblå og omkranset med sort, mens etiketter og et minimalt tema tilføjes for tydelighed.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Dette plot viser den overordnede form på fordelingen af salgspriser, hvilket gør det nemt at se, om de fleste biler ligger inden for et bestemt prisinterval, eller om der er outliers i den høje eller lave ende.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Can you explain the difference between a histogram and a bar plot?
How do I choose the right number of bins for my histogram?
What does it mean if my histogram is skewed to the right or left?
Awesome!
Completion rate improved to 4
Oprettelse af Histogrammer
Stryg for at vise menuen
Hvorfor bruge histogrammer?
Histogrammer anvendes til at visualisere fordelingen af kontinuerlige (numeriske) data. De viser, hvordan data er fordelt på intervaller (bins) og hjælper med at:
- Identificere skævhed, outliers eller huller;
- Forstå frekvensfordeling;
- Hurtigt vurdere, om dataene er normalfordelte eller ej.
De egner sig bedst til variable som pris, kilometertal eller alder.
Histogram-syntaks i ggplot2
Et histogram kan oprettes med geom_histogram()
, hvor variablen x
skal være numerisk.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
Udseendet af histogrammet kan tilpasses med argumenter som bins
(antal bins), fill
(søjlens farve), color
(kantfarve) og theme
til styling.
Eksempel: Fordeling af salgspriser
Et histogram kan bruges til at undersøge, hvordan bilpriser er fordelt i datasættet. I dette eksempel er søjlerne udfyldt med stålblå og omkranset med sort, mens etiketter og et minimalt tema tilføjes for tydelighed.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Dette plot viser den overordnede form på fordelingen af salgspriser, hvilket gør det nemt at se, om de fleste biler ligger inden for et bestemt prisinterval, eller om der er outliers i den høje eller lave ende.
Tak for dine kommentarer!