Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Hajontakuvioiden Luominen | Datan Visualisointi
Datan analysointi R:llä

bookHajontakuvioiden Luominen

Miksi käyttää hajontakuvioita?

Hajontakuvio soveltuu erinomaisesti muuttujien välisten suhteiden visualisointiin. Sitä voidaan käyttää:

  • Näyttämään kahden numeerisen muuttujan suhteet;
  • Havaitsemaan kuvioita, klustereita tai poikkeavia havaintoja;
  • Tutkimaan korrelaatiota (positiivinen/negatiivinen/ei korrelaatiota).

Hajontakuvion syntaksi ggplot2:ssa

Hajontakuvion voi luoda funktiolla geom_point(). Määritä tällöin sekä x- että y-akselin estetiikat.

ggplot(data = df, aes(x = variable_x, y = variable_y)) +
  geom_point()

Erottelun lisäämiseksi voit lisätä ryhmittelymuuttujan color-estetiikkaan. Tämä antaa jokaiselle ryhmälle eri värin, mikä helpottaa kuvioiden tunnistamista.

ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
  geom_point()

Esimerkki: Myyntihinta vs. ajetut kilometrit

Hajontakuviolla voidaan tarkastella, miten auton käyttö vaikuttaa sen myyntihintaan. Tässä esimerkissä x-akselilla esitetään ajetut kilometrit ja y-akselilla myyntihinta.

ggplot(df, aes(x = km_driven, y = selling_price)) +
  geom_point() +
  labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
       x = "Kilometers Driven",
       y = "Selling Price")

Tämä visualisointi tuo usein esiin arvonalenemisen trendejä – kun ajokilometrit kasvavat, myyntihinta yleensä laskee. Lisäksi se voi paljastaa poikkeavia havaintoja, kuten autot, joiden hinta on poikkeuksellisen korkea suuresta ajomäärästä huolimatta.

question mark

Mikä ggplot2-funktio luo hajontakuvion?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 5

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain how to interpret a scatter plot?

What does a negative correlation look like on a scatter plot?

How can I identify outliers using a scatter plot?

Awesome!

Completion rate improved to 4

bookHajontakuvioiden Luominen

Pyyhkäise näyttääksesi valikon

Miksi käyttää hajontakuvioita?

Hajontakuvio soveltuu erinomaisesti muuttujien välisten suhteiden visualisointiin. Sitä voidaan käyttää:

  • Näyttämään kahden numeerisen muuttujan suhteet;
  • Havaitsemaan kuvioita, klustereita tai poikkeavia havaintoja;
  • Tutkimaan korrelaatiota (positiivinen/negatiivinen/ei korrelaatiota).

Hajontakuvion syntaksi ggplot2:ssa

Hajontakuvion voi luoda funktiolla geom_point(). Määritä tällöin sekä x- että y-akselin estetiikat.

ggplot(data = df, aes(x = variable_x, y = variable_y)) +
  geom_point()

Erottelun lisäämiseksi voit lisätä ryhmittelymuuttujan color-estetiikkaan. Tämä antaa jokaiselle ryhmälle eri värin, mikä helpottaa kuvioiden tunnistamista.

ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
  geom_point()

Esimerkki: Myyntihinta vs. ajetut kilometrit

Hajontakuviolla voidaan tarkastella, miten auton käyttö vaikuttaa sen myyntihintaan. Tässä esimerkissä x-akselilla esitetään ajetut kilometrit ja y-akselilla myyntihinta.

ggplot(df, aes(x = km_driven, y = selling_price)) +
  geom_point() +
  labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
       x = "Kilometers Driven",
       y = "Selling Price")

Tämä visualisointi tuo usein esiin arvonalenemisen trendejä – kun ajokilometrit kasvavat, myyntihinta yleensä laskee. Lisäksi se voi paljastaa poikkeavia havaintoja, kuten autot, joiden hinta on poikkeuksellisen korkea suuresta ajomäärästä huolimatta.

question mark

Mikä ggplot2-funktio luo hajontakuvion?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 5
some-alt