Tiheyskuvaajien Luominen
Pyyhkäise näyttääksesi valikon
Miksi käyttää tiheyskäyriä?
Tiheyskäyrä on histogrammin tasoitettu versio. Se on hyödyllinen:
- Numeraalisen muuttujan jakauman ymmärtämiseen;
- Jakaumien vertailuun ryhmien välillä (esim. polttoainetyypit);
- Huippujen, vinouman ja hajonnan havaitsemiseen.
Toisin kuin histogrammit, tiheyskäyrät arvioivat todennäköisyyttä, että arvo esiintyy tietyllä välillä.
Tiheyskäyrän syntaksi ggplot2:ssa
ggplot2-kirjastossa tiheyskäyrä luodaan komennolla geom_density().
ggplot(data = df, aes(x = variable)) +
geom_density()
Ryhmiä vertaillessa kategorinen muuttuja voidaan asettaa fill-parametriin ja läpinäkyvyyttä säätää alpha-parametrilla, jotta käyrät näkyvät selkeästi päällekkäin.
ggplot(data = df, aes(x = variable, fill = group_variable)) +
geom_density(alpha = 0.5)
Tämä helpottaa numeerisen muuttujan jakauman vertailua eri kategorioiden välillä.
Esimerkki: Myyntihintojen jakauma
Tiheyskäyrä antaa tasoitetun kuvan siitä, miten automyyntihinnat jakautuvat. Tässä esimerkissä käyrä on täytetty sinisellä ja akselien nimet selventävät arvojen merkitystä.
ggplot(df, aes(x = selling_price)) +
geom_density(fill = "blue") +
labs(title = "Density Plot of Selling Prices",
x = "Selling Price",
y = "Density")
Tämä visualisointi korostaa, mihin hintaluokkiin suurin osa autoista sijoittuu, sekä kuinka laajasti hinnat vaihtelevat aineistossa. Se on erityisen hyödyllinen jakauman huippujen tunnistamiseen ja myöhempään vertailuun muihin muuttujiin.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme