Tiheyskuvaajien Luominen
Miksi käyttää tiheyskäyriä?
Tiheyskäyrä on histogrammin tasoitettu versio. Se on hyödyllinen:
- Numeraalisen muuttujan jakauman ymmärtämiseen;
- Jakaumien vertailuun ryhmien välillä (esim. polttoainetyypit);
- Huippujen, vinouman ja hajonnan havaitsemiseen.
Toisin kuin histogrammit, tiheyskäyrät arvioivat arvon esiintymistodennäköisyyttä tietyllä välillä.
Tiheyskäyrän syntaksi ggplot2:ssa
ggplot2-kirjastossa tiheyskäyrä luodaan funktiolla geom_density()
.
ggplot(data = df, aes(x = variable)) +
geom_density()
Ryhmiä vertaillessa kategorinen muuttuja voidaan asettaa fill
-parametriin ja läpinäkyvyyttä säätää alpha
-parametrilla, jotta käyrät näkyvät selkeästi päällekkäin.
ggplot(data = df, aes(x = variable, fill = group_variable)) +
geom_density(alpha = 0.5)
Tämä helpottaa numeerisen muuttujan jakauman vertailua eri kategorioiden välillä.
Esimerkki: Myyntihinnan jakauma
Tiheyskäyrä antaa tasoitetun kuvan autojen hintojen jakaumasta. Tässä esimerkissä käyrä on täytetty sinisellä ja akselien nimet selventävät arvojen merkitystä.
ggplot(df, aes(x = selling_price)) +
geom_density(fill = "blue") +
labs(title = "Density Plot of Selling Prices",
x = "Selling Price",
y = "Density")
Tämä visualisointi korostaa, mihin hintaluokkiin suurin osa autoista sijoittuu sekä kuinka laajasti hinnat jakautuvat aineistossa. Se on erityisen hyödyllinen jakauman huippujen tunnistamiseen ja myöhempään vertailuun muihin muuttujin.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 4
Tiheyskuvaajien Luominen
Pyyhkäise näyttääksesi valikon
Miksi käyttää tiheyskäyriä?
Tiheyskäyrä on histogrammin tasoitettu versio. Se on hyödyllinen:
- Numeraalisen muuttujan jakauman ymmärtämiseen;
- Jakaumien vertailuun ryhmien välillä (esim. polttoainetyypit);
- Huippujen, vinouman ja hajonnan havaitsemiseen.
Toisin kuin histogrammit, tiheyskäyrät arvioivat arvon esiintymistodennäköisyyttä tietyllä välillä.
Tiheyskäyrän syntaksi ggplot2:ssa
ggplot2-kirjastossa tiheyskäyrä luodaan funktiolla geom_density()
.
ggplot(data = df, aes(x = variable)) +
geom_density()
Ryhmiä vertaillessa kategorinen muuttuja voidaan asettaa fill
-parametriin ja läpinäkyvyyttä säätää alpha
-parametrilla, jotta käyrät näkyvät selkeästi päällekkäin.
ggplot(data = df, aes(x = variable, fill = group_variable)) +
geom_density(alpha = 0.5)
Tämä helpottaa numeerisen muuttujan jakauman vertailua eri kategorioiden välillä.
Esimerkki: Myyntihinnan jakauma
Tiheyskäyrä antaa tasoitetun kuvan autojen hintojen jakaumasta. Tässä esimerkissä käyrä on täytetty sinisellä ja akselien nimet selventävät arvojen merkitystä.
ggplot(df, aes(x = selling_price)) +
geom_density(fill = "blue") +
labs(title = "Density Plot of Selling Prices",
x = "Selling Price",
y = "Density")
Tämä visualisointi korostaa, mihin hintaluokkiin suurin osa autoista sijoittuu sekä kuinka laajasti hinnat jakautuvat aineistossa. Se on erityisen hyödyllinen jakauman huippujen tunnistamiseen ja myöhempään vertailuun muihin muuttujin.
Kiitos palautteestasi!