Hajontakuvioiden Luominen
Miksi käyttää hajontakuvioita?
Hajontakuvio soveltuu erinomaisesti muuttujien välisten suhteiden visualisointiin. Sitä voidaan käyttää:
- Näyttämään kahden numeerisen muuttujan suhteet;
- Havaitsemaan kuvioita, klustereita tai poikkeavia havaintoja;
- Tutkimaan korrelaatiota (positiivinen/negatiivinen/ei korrelaatiota).
Hajontakuvion syntaksi ggplot2:ssa
Hajontakuvion voi luoda funktiolla geom_point()
. Määritä tällöin sekä x
- että y
-akselin estetiikat.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
Erottelun lisäämiseksi voit lisätä ryhmittelymuuttujan color
-estetiikkaan. Tämä antaa jokaiselle ryhmälle eri värin, mikä helpottaa kuvioiden tunnistamista.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Esimerkki: Myyntihinta vs. ajetut kilometrit
Hajontakuviolla voidaan tarkastella, miten auton käyttö vaikuttaa sen myyntihintaan. Tässä esimerkissä x-akselilla esitetään ajetut kilometrit ja y-akselilla myyntihinta.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Tämä visualisointi tuo usein esiin arvonalenemisen trendejä – kun ajokilometrit kasvavat, myyntihinta yleensä laskee. Lisäksi se voi paljastaa poikkeavia havaintoja, kuten autot, joiden hinta on poikkeuksellisen korkea suuresta ajomäärästä huolimatta.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain how to interpret a scatter plot?
What does a negative correlation look like on a scatter plot?
How can I identify outliers using a scatter plot?
Awesome!
Completion rate improved to 4
Hajontakuvioiden Luominen
Pyyhkäise näyttääksesi valikon
Miksi käyttää hajontakuvioita?
Hajontakuvio soveltuu erinomaisesti muuttujien välisten suhteiden visualisointiin. Sitä voidaan käyttää:
- Näyttämään kahden numeerisen muuttujan suhteet;
- Havaitsemaan kuvioita, klustereita tai poikkeavia havaintoja;
- Tutkimaan korrelaatiota (positiivinen/negatiivinen/ei korrelaatiota).
Hajontakuvion syntaksi ggplot2:ssa
Hajontakuvion voi luoda funktiolla geom_point()
. Määritä tällöin sekä x
- että y
-akselin estetiikat.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
Erottelun lisäämiseksi voit lisätä ryhmittelymuuttujan color
-estetiikkaan. Tämä antaa jokaiselle ryhmälle eri värin, mikä helpottaa kuvioiden tunnistamista.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Esimerkki: Myyntihinta vs. ajetut kilometrit
Hajontakuviolla voidaan tarkastella, miten auton käyttö vaikuttaa sen myyntihintaan. Tässä esimerkissä x-akselilla esitetään ajetut kilometrit ja y-akselilla myyntihinta.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Tämä visualisointi tuo usein esiin arvonalenemisen trendejä – kun ajokilometrit kasvavat, myyntihinta yleensä laskee. Lisäksi se voi paljastaa poikkeavia havaintoja, kuten autot, joiden hinta on poikkeuksellisen korkea suuresta ajomäärästä huolimatta.
Kiitos palautteestasi!