Tiheyskuvaajien Luominen
Miksi käyttää tiheyskäyriä?
Tiheyskäyrä on histogrammin tasoitettu versio. Se on hyödyllinen:
- Jakauman hahmottamiseen numeeriselle muuttujalle;
- Jakaumien vertailuun ryhmien välillä (esim. polttoainetyypit);
- Huippujen, vinouman ja hajonnan tunnistamiseen.
Toisin kuin histogrammit, tiheyskäyrät arvioivat todennäköisyyttä, että arvo esiintyy tietyllä välillä.
Tiheyskäyrän syntaksi ggplot2:ssa
ggplot2-kirjastossa tiheyskäyrä luodaan funktiolla geom_density()
.
ggplot(data = df, aes(x = variable)) +
geom_density()
Ryhmiä vertaillessa kategorinen muuttuja voidaan asettaa fill
-parametriin ja läpinäkyvyyttä säätää alpha
-parametrilla, jotta käyrät näkyvät päällekkäin selkeästi.
ggplot(data = df, aes(x = variable, fill = group_variable)) +
geom_density(alpha = 0.5)
Tämä helpottaa numeerisen muuttujan jakauman vertailua eri kategorioiden välillä.
Esimerkki: Myyntihintojen jakauma
Tiheyskäyrä antaa tasoitetun kuvan siitä, miten automyyntihinnat jakautuvat. Tässä esimerkissä käyrä on täytetty sinisellä ja akselien nimet selventävät arvojen merkitystä.
ggplot(df, aes(x = selling_price)) +
geom_density(fill = "blue") +
labs(title = "Density Plot of Selling Prices",
x = "Selling Price",
y = "Density")
Tämä visualisointi korostaa, mihin hintaluokkiin suurin osa autoista sijoittuu ja kuinka laajasti hinnat vaihtelevat aineistossa. Se on erityisen hyödyllinen jakauman huippujen tunnistamiseen ja myöhempään vertailuun muihin muuttujiiin.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
What is the difference between a density plot and a histogram?
How do I interpret the peaks and tails in a density plot?
Can you explain how to compare distributions using density plots?
Awesome!
Completion rate improved to 4
Tiheyskuvaajien Luominen
Pyyhkäise näyttääksesi valikon
Miksi käyttää tiheyskäyriä?
Tiheyskäyrä on histogrammin tasoitettu versio. Se on hyödyllinen:
- Jakauman hahmottamiseen numeeriselle muuttujalle;
- Jakaumien vertailuun ryhmien välillä (esim. polttoainetyypit);
- Huippujen, vinouman ja hajonnan tunnistamiseen.
Toisin kuin histogrammit, tiheyskäyrät arvioivat todennäköisyyttä, että arvo esiintyy tietyllä välillä.
Tiheyskäyrän syntaksi ggplot2:ssa
ggplot2-kirjastossa tiheyskäyrä luodaan funktiolla geom_density()
.
ggplot(data = df, aes(x = variable)) +
geom_density()
Ryhmiä vertaillessa kategorinen muuttuja voidaan asettaa fill
-parametriin ja läpinäkyvyyttä säätää alpha
-parametrilla, jotta käyrät näkyvät päällekkäin selkeästi.
ggplot(data = df, aes(x = variable, fill = group_variable)) +
geom_density(alpha = 0.5)
Tämä helpottaa numeerisen muuttujan jakauman vertailua eri kategorioiden välillä.
Esimerkki: Myyntihintojen jakauma
Tiheyskäyrä antaa tasoitetun kuvan siitä, miten automyyntihinnat jakautuvat. Tässä esimerkissä käyrä on täytetty sinisellä ja akselien nimet selventävät arvojen merkitystä.
ggplot(df, aes(x = selling_price)) +
geom_density(fill = "blue") +
labs(title = "Density Plot of Selling Prices",
x = "Selling Price",
y = "Density")
Tämä visualisointi korostaa, mihin hintaluokkiin suurin osa autoista sijoittuu ja kuinka laajasti hinnat vaihtelevat aineistossa. Se on erityisen hyödyllinen jakauman huippujen tunnistamiseen ja myöhempään vertailuun muihin muuttujiiin.
Kiitos palautteestasi!