Oprettelse af Histogrammer
Hvorfor bruge histogrammer?
Histogrammer bruges til at visualisere fordelingen af kontinuerlige (numeriske) data. De viser, hvordan data er fordelt på intervaller (bins) og hjælper med at:
- Identificere skævhed, outliers eller huller;
- Forstå frekvensfordeling;
- Hurtigt vurdere, om dataene er normalfordelte eller ej.
De egner sig bedst til variable som pris, kilometertal eller alder.
Histogram-syntaks i ggplot2
Du kan oprette et histogram ved hjælp af geom_histogram()
, hvor x
-variablen skal være numerisk.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
Udseendet af histogrammet kan tilpasses med argumenter som bins
(antal bins), fill
(søjlens farve), color
(kantfarve) og theme
til styling.
Eksempel: Fordeling af salgspriser
Et histogram kan bruges til at undersøge, hvordan bilpriser er fordelt i datasættet. I dette eksempel er søjlerne udfyldt med steel blue og omkranset med sort, mens etiketter og et minimalt tema tilføjes for tydelighed.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Dette plot viser den overordnede form på fordelingen af salgspriser, hvilket gør det nemt at se, om de fleste biler ligger inden for et bestemt prisinterval, eller om der er outliers i den høje eller lave ende.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 4
Oprettelse af Histogrammer
Stryg for at vise menuen
Hvorfor bruge histogrammer?
Histogrammer bruges til at visualisere fordelingen af kontinuerlige (numeriske) data. De viser, hvordan data er fordelt på intervaller (bins) og hjælper med at:
- Identificere skævhed, outliers eller huller;
- Forstå frekvensfordeling;
- Hurtigt vurdere, om dataene er normalfordelte eller ej.
De egner sig bedst til variable som pris, kilometertal eller alder.
Histogram-syntaks i ggplot2
Du kan oprette et histogram ved hjælp af geom_histogram()
, hvor x
-variablen skal være numerisk.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
Udseendet af histogrammet kan tilpasses med argumenter som bins
(antal bins), fill
(søjlens farve), color
(kantfarve) og theme
til styling.
Eksempel: Fordeling af salgspriser
Et histogram kan bruges til at undersøge, hvordan bilpriser er fordelt i datasættet. I dette eksempel er søjlerne udfyldt med steel blue og omkranset med sort, mens etiketter og et minimalt tema tilføjes for tydelighed.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Dette plot viser den overordnede form på fordelingen af salgspriser, hvilket gør det nemt at se, om de fleste biler ligger inden for et bestemt prisinterval, eller om der er outliers i den høje eller lave ende.
Tak for dine kommentarer!