Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Tiheyskuvaajien Luominen | Datan Visualisointi
Datan analysointi R:llä

bookTiheyskuvaajien Luominen

Miksi käyttää tiheyskäyriä?

Tiheyskäyrä on histogrammin tasoitettu versio. Se on hyödyllinen:

  • Jakauman hahmottamiseen numeeriselle muuttujalle;
  • Jakaumien vertailuun ryhmien välillä (esim. polttoainetyypit);
  • Huippujen, vinouman ja hajonnan tunnistamiseen.

Toisin kuin histogrammit, tiheyskäyrät arvioivat todennäköisyyttä, että arvo esiintyy tietyllä välillä.

Tiheyskäyrän syntaksi ggplot2:ssa

ggplot2-kirjastossa tiheyskäyrä luodaan funktiolla geom_density().

ggplot(data = df, aes(x = variable)) +
  geom_density()

Ryhmiä vertaillessa kategorinen muuttuja voidaan asettaa fill-parametriin ja läpinäkyvyyttä säätää alpha-parametrilla, jotta käyrät näkyvät päällekkäin selkeästi.

ggplot(data = df, aes(x = variable, fill = group_variable)) +
  geom_density(alpha = 0.5)

Tämä helpottaa numeerisen muuttujan jakauman vertailua eri kategorioiden välillä.

Esimerkki: Myyntihintojen jakauma

Tiheyskäyrä antaa tasoitetun kuvan siitä, miten automyyntihinnat jakautuvat. Tässä esimerkissä käyrä on täytetty sinisellä ja akselien nimet selventävät arvojen merkitystä.

ggplot(df, aes(x = selling_price)) +
  geom_density(fill = "blue") +
  labs(title = "Density Plot of Selling Prices",
       x = "Selling Price",
       y = "Density")

Tämä visualisointi korostaa, mihin hintaluokkiin suurin osa autoista sijoittuu ja kuinka laajasti hinnat vaihtelevat aineistossa. Se on erityisen hyödyllinen jakauman huippujen tunnistamiseen ja myöhempään vertailuun muihin muuttujiiin.

question mark

Mikä argumentti ohjaa päällekkäisten tiheyskäyrien läpinäkyvyyttä?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 4

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

What is the difference between a density plot and a histogram?

How do I interpret the peaks and tails in a density plot?

Can you explain how to compare distributions using density plots?

Awesome!

Completion rate improved to 4

bookTiheyskuvaajien Luominen

Pyyhkäise näyttääksesi valikon

Miksi käyttää tiheyskäyriä?

Tiheyskäyrä on histogrammin tasoitettu versio. Se on hyödyllinen:

  • Jakauman hahmottamiseen numeeriselle muuttujalle;
  • Jakaumien vertailuun ryhmien välillä (esim. polttoainetyypit);
  • Huippujen, vinouman ja hajonnan tunnistamiseen.

Toisin kuin histogrammit, tiheyskäyrät arvioivat todennäköisyyttä, että arvo esiintyy tietyllä välillä.

Tiheyskäyrän syntaksi ggplot2:ssa

ggplot2-kirjastossa tiheyskäyrä luodaan funktiolla geom_density().

ggplot(data = df, aes(x = variable)) +
  geom_density()

Ryhmiä vertaillessa kategorinen muuttuja voidaan asettaa fill-parametriin ja läpinäkyvyyttä säätää alpha-parametrilla, jotta käyrät näkyvät päällekkäin selkeästi.

ggplot(data = df, aes(x = variable, fill = group_variable)) +
  geom_density(alpha = 0.5)

Tämä helpottaa numeerisen muuttujan jakauman vertailua eri kategorioiden välillä.

Esimerkki: Myyntihintojen jakauma

Tiheyskäyrä antaa tasoitetun kuvan siitä, miten automyyntihinnat jakautuvat. Tässä esimerkissä käyrä on täytetty sinisellä ja akselien nimet selventävät arvojen merkitystä.

ggplot(df, aes(x = selling_price)) +
  geom_density(fill = "blue") +
  labs(title = "Density Plot of Selling Prices",
       x = "Selling Price",
       y = "Density")

Tämä visualisointi korostaa, mihin hintaluokkiin suurin osa autoista sijoittuu ja kuinka laajasti hinnat vaihtelevat aineistossa. Se on erityisen hyödyllinen jakauman huippujen tunnistamiseen ja myöhempään vertailuun muihin muuttujiiin.

question mark

Mikä argumentti ohjaa päällekkäisten tiheyskäyrien läpinäkyvyyttä?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 4
some-alt