Hajontakuvioiden Luominen
Pyyhkäise näyttääksesi valikon
Miksi käyttää hajontakuvioita?
Hajontakuvio soveltuu erinomaisesti muuttujien välisten suhteiden visualisointiin. Sitä voidaan käyttää:
- Näyttämään kahden numeerisen muuttujan suhteet;
- Havaitsemaan kuvioita, klustereita tai poikkeavia havaintoja;
- Tutkimaan korrelaatiota (positiivinen/negatiivinen/ei korrelaatiota).
Hajontakuvion syntaksi ggplot2:ssa
Hajontakuvion voi luoda funktiolla geom_point(). Määrittele sekä x- että y-akselin estetiikat.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
Ryhmien erottamiseksi datassa voit lisätä ryhmittelymuuttujan color-estetiikkaan. Tämä antaa jokaiselle ryhmälle eri värin, mikä helpottaa kuvioiden havaitsemista.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Esimerkki: Myyntihinta vs. ajetut kilometrit
Hajontakuviolla voidaan tarkastella, miten auton käyttö vaikuttaa sen myyntihintaan. Tässä esimerkissä x-akselilla esitetään ajetut kilometrit ja y-akselilla myyntihinta.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Tämä visualisointi tuo usein esiin arvonalenemisen trendejä – kun ajokilometrit kasvavat, myyntihinta yleensä laskee. Lisäksi se voi paljastaa poikkeavia havaintoja, kuten autot, joiden hinta on poikkeuksellisen korkea suuresta ajomäärästä huolimatta.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme