Hajontakuvioiden Luominen
Miksi käyttää hajontakuvioita?
Hajontakuvio soveltuu erinomaisesti muuttujien välisten suhteiden havainnollistamiseen. Sitä voidaan käyttää:
- Näyttämään kahden numeerisen muuttujan suhteet;
- Havaitsemaan kuvioita, ryhmittymiä tai poikkeavia havaintoja;
- Tutkimaan korrelaatiota (positiivinen/negatiivinen/ei korrelaatiota).
Hajontakuvion syntaksi ggplot2:ssa
Hajontakuvio luodaan funktiolla geom_point(). Määritä sekä x- että y-akselin estetiikat.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
Aineiston ryhmien erottamiseksi voidaan lisätä ryhmittelymuuttuja color-estetiikkaan. Tämä antaa jokaiselle ryhmälle oman värin, mikä helpottaa kuvioiden tunnistamista.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Esimerkki: Myyntihinta vs. ajetut kilometrit
Hajontakuviolla voidaan tarkastella, miten auton käyttö vaikuttaa sen myyntihintaan. Tässä esimerkissä x-akselilla esitetään ajetut kilometrit ja y-akselilla myyntihinta.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Tämä visualisointi tuo usein esiin arvon alenemisen trendejä – kun ajokilometrit kasvavat, myyntihinta yleensä laskee. Lisäksi se voi paljastaa poikkeavia havaintoja, kuten autot, joiden hinta on poikkeuksellisen korkea suuresta ajomäärästä huolimatta.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain how to interpret a scatter plot?
What does a negative correlation look like on a scatter plot?
How can I identify outliers using a scatter plot?
Awesome!
Completion rate improved to 4
Hajontakuvioiden Luominen
Pyyhkäise näyttääksesi valikon
Miksi käyttää hajontakuvioita?
Hajontakuvio soveltuu erinomaisesti muuttujien välisten suhteiden havainnollistamiseen. Sitä voidaan käyttää:
- Näyttämään kahden numeerisen muuttujan suhteet;
- Havaitsemaan kuvioita, ryhmittymiä tai poikkeavia havaintoja;
- Tutkimaan korrelaatiota (positiivinen/negatiivinen/ei korrelaatiota).
Hajontakuvion syntaksi ggplot2:ssa
Hajontakuvio luodaan funktiolla geom_point(). Määritä sekä x- että y-akselin estetiikat.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
Aineiston ryhmien erottamiseksi voidaan lisätä ryhmittelymuuttuja color-estetiikkaan. Tämä antaa jokaiselle ryhmälle oman värin, mikä helpottaa kuvioiden tunnistamista.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Esimerkki: Myyntihinta vs. ajetut kilometrit
Hajontakuviolla voidaan tarkastella, miten auton käyttö vaikuttaa sen myyntihintaan. Tässä esimerkissä x-akselilla esitetään ajetut kilometrit ja y-akselilla myyntihinta.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Tämä visualisointi tuo usein esiin arvon alenemisen trendejä – kun ajokilometrit kasvavat, myyntihinta yleensä laskee. Lisäksi se voi paljastaa poikkeavia havaintoja, kuten autot, joiden hinta on poikkeuksellisen korkea suuresta ajomäärästä huolimatta.
Kiitos palautteestasi!