Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Tiheyskuvaajien Luominen | Datan Visualisointi
Datan Analysointi R:llä

bookTiheyskuvaajien Luominen

Miksi käyttää tiheyskäyriä?

Tiheyskäyrä on histogrammin tasoitettu versio. Se on hyödyllinen:

  • Numeraalisen muuttujan jakauman ymmärtämiseen;
  • Jakaumien vertailuun ryhmien välillä (esim. polttoainetyypit);
  • Huippujen, vinouman ja hajonnan havaitsemiseen.

Toisin kuin histogrammit, tiheyskäyrät arvioivat arvon esiintymistodennäköisyyttä tietyllä välillä.

Tiheyskäyrän syntaksi ggplot2:ssa

ggplot2-kirjastossa tiheyskäyrä luodaan funktiolla geom_density().

ggplot(data = df, aes(x = variable)) +
  geom_density()

Ryhmiä vertaillessa kategorinen muuttuja voidaan asettaa fill-parametriin ja läpinäkyvyyttä säätää alpha-parametrilla, jotta käyrät näkyvät selkeästi päällekkäin.

ggplot(data = df, aes(x = variable, fill = group_variable)) +
  geom_density(alpha = 0.5)

Tämä helpottaa numeerisen muuttujan jakauman vertailua eri kategorioiden välillä.

Esimerkki: Myyntihinnan jakauma

Tiheyskäyrä antaa tasoitetun kuvan autojen hintojen jakaumasta. Tässä esimerkissä käyrä on täytetty sinisellä ja akselien nimet selventävät arvojen merkitystä.

ggplot(df, aes(x = selling_price)) +
  geom_density(fill = "blue") +
  labs(title = "Density Plot of Selling Prices",
       x = "Selling Price",
       y = "Density")

Tämä visualisointi korostaa, mihin hintaluokkiin suurin osa autoista sijoittuu sekä kuinka laajasti hinnat jakautuvat aineistossa. Se on erityisen hyödyllinen jakauman huippujen tunnistamiseen ja myöhempään vertailuun muihin muuttujin.

question mark

Mikä argumentti ohjaa päällekkäisten tiheyskäyrien läpinäkyvyyttä?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 4

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 4

bookTiheyskuvaajien Luominen

Pyyhkäise näyttääksesi valikon

Miksi käyttää tiheyskäyriä?

Tiheyskäyrä on histogrammin tasoitettu versio. Se on hyödyllinen:

  • Numeraalisen muuttujan jakauman ymmärtämiseen;
  • Jakaumien vertailuun ryhmien välillä (esim. polttoainetyypit);
  • Huippujen, vinouman ja hajonnan havaitsemiseen.

Toisin kuin histogrammit, tiheyskäyrät arvioivat arvon esiintymistodennäköisyyttä tietyllä välillä.

Tiheyskäyrän syntaksi ggplot2:ssa

ggplot2-kirjastossa tiheyskäyrä luodaan funktiolla geom_density().

ggplot(data = df, aes(x = variable)) +
  geom_density()

Ryhmiä vertaillessa kategorinen muuttuja voidaan asettaa fill-parametriin ja läpinäkyvyyttä säätää alpha-parametrilla, jotta käyrät näkyvät selkeästi päällekkäin.

ggplot(data = df, aes(x = variable, fill = group_variable)) +
  geom_density(alpha = 0.5)

Tämä helpottaa numeerisen muuttujan jakauman vertailua eri kategorioiden välillä.

Esimerkki: Myyntihinnan jakauma

Tiheyskäyrä antaa tasoitetun kuvan autojen hintojen jakaumasta. Tässä esimerkissä käyrä on täytetty sinisellä ja akselien nimet selventävät arvojen merkitystä.

ggplot(df, aes(x = selling_price)) +
  geom_density(fill = "blue") +
  labs(title = "Density Plot of Selling Prices",
       x = "Selling Price",
       y = "Density")

Tämä visualisointi korostaa, mihin hintaluokkiin suurin osa autoista sijoittuu sekä kuinka laajasti hinnat jakautuvat aineistossa. Se on erityisen hyödyllinen jakauman huippujen tunnistamiseen ja myöhempään vertailuun muihin muuttujin.

question mark

Mikä argumentti ohjaa päällekkäisten tiheyskäyrien läpinäkyvyyttä?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 4
some-alt