Histogrammien Luominen
Pyyhkäise näyttääksesi valikon
Miksi käyttää histogrammeja?
Histogrammit visualisoivat jatkuvan (numeerisen) datan jakaumaa. Ne näyttävät, miten data jakautuu alueisiin (binneihin) ja auttavat:
- Havaitsemaan vinouman, poikkeamat tai aukot;
- Ymmärtämään frekvenssijakauman;
- Arvioimaan nopeasti, onko data normaalijakautunutta vai ei.
Parhaiten soveltuvat muuttujille kuten hinta, ajokilometrit tai ikä.
Histogrammin syntaksi ggplot2:ssa
Histogrammin voi luoda käyttämällä geom_histogram(), jossa x-muuttujan tulee olla numeerinen.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
Histogrammin ulkoasua voi muokata argumenteilla kuten bins (binien määrä), fill (palkkien väri), color (reunojen väri) ja theme tyylin määrittelyyn.
Esimerkki: Myyntihintojen jakauma
Histogrammia voidaan käyttää tarkastelemaan, miten autojen hinnat jakautuvat aineistossa. Tässä esimerkissä palkit täytetään teräksen sinisellä ja reunat ovat mustat, ja selkeyden vuoksi lisätään otsikot sekä minimaalinen teema.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Tämä kuvaaja paljastaa myyntihintojen jakauman yleisen muodon, jolloin on helppo nähdä, sijoittuvatko suurin osa autoista tietylle hintavälille vai esiintyykö poikkeavia arvoja ylä- tai alapäässä.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme