Lage Histogrammer
Hvorfor bruke histogrammer?
Histogrammer brukes til å visualisere fordelingen av kontinuerlige (numeriske) data. De viser hvordan data er fordelt over intervaller (bøtter) og hjelper til med å:
- Avdekke skjevhet, uteliggere eller hull;
- Forstå frekvensfordeling;
- Raskt vurdere om dataene er normalfordelte eller ikke.
De egner seg best for variabler som pris, kjørelengde eller alder.
Histogramsyntaks i ggplot2
Du kan lage et histogram ved å bruke geom_histogram()
, hvor x
-variabelen må være numerisk.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
Utseendet til histogrammet kan tilpasses med argumenter som bins
(antall bøtter), fill
(søylefarge), color
(kantfarge) og theme
for stil.
Eksempel: Fordeling av salgspriser
Et histogram kan brukes til å undersøke hvordan bilpriser er fordelt i datasettet. I dette eksemplet er søylene fylt med stålblå og har svart kant, mens etiketter og et minimalt tema er lagt til for tydelighet.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Dette diagrammet viser den overordnede formen på fordelingen av salgspriser, noe som gjør det enkelt å se om de fleste biler faller innenfor et bestemt prissjikt eller om det finnes uteliggere i den høye eller lave enden.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Can you explain the difference between a histogram and a bar plot?
How do I choose the right number of bins for my histogram?
What does it mean if my histogram is skewed to the right or left?
Awesome!
Completion rate improved to 4
Lage Histogrammer
Sveip for å vise menyen
Hvorfor bruke histogrammer?
Histogrammer brukes til å visualisere fordelingen av kontinuerlige (numeriske) data. De viser hvordan data er fordelt over intervaller (bøtter) og hjelper til med å:
- Avdekke skjevhet, uteliggere eller hull;
- Forstå frekvensfordeling;
- Raskt vurdere om dataene er normalfordelte eller ikke.
De egner seg best for variabler som pris, kjørelengde eller alder.
Histogramsyntaks i ggplot2
Du kan lage et histogram ved å bruke geom_histogram()
, hvor x
-variabelen må være numerisk.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
Utseendet til histogrammet kan tilpasses med argumenter som bins
(antall bøtter), fill
(søylefarge), color
(kantfarge) og theme
for stil.
Eksempel: Fordeling av salgspriser
Et histogram kan brukes til å undersøke hvordan bilpriser er fordelt i datasettet. I dette eksemplet er søylene fylt med stålblå og har svart kant, mens etiketter og et minimalt tema er lagt til for tydelighet.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Dette diagrammet viser den overordnede formen på fordelingen av salgspriser, noe som gjør det enkelt å se om de fleste biler faller innenfor et bestemt prissjikt eller om det finnes uteliggere i den høye eller lave enden.
Takk for tilbakemeldingene dine!