Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Pylväsdiagrammien Luominen | Datan Visualisointi
Datan analysointi R:llä

bookPylväsdiagrammien Luominen

Miksi käyttää pylväsdiagrammeja?

Pylväsdiagrammit ovat yksi yleisimmistä tavoista visualisoida luokittelu- eli kategorista dataa. Niitä käytetään:

  • Kategorioiden lukumäärien tai frekvenssien vertailuun;
  • Ryhmäkohtaisten yhteenvetojen visualisointiin (esim. polttoainetyyppien keskihinta);
  • Kahden kategorisen muuttujan välisten suhteiden havainnollistamiseen ryhmitellyillä tai pinotuilla pylväillä.

Olipa kyseessä autojen määrä polttoainetyypeittäin tai vaihteistotyyppien vertailu polttoaineiden välillä, pylväsdiagrammit tekevät kategorisista vertailuista selkeitä ja helposti ymmärrettäviä.

Pylväsdiagrammin syntaksi ggplot2:ssa

Pylväsdiagrammi voidaan luoda ggplot2-kirjastolla käyttämällä geom_bar(). Kun määritetään vain x-esteettinen ominaisuus, geom_bar() laskee automaattisesti havaintojen määrän jokaisessa kategoriassa.

ggplot(data = df, aes(x = category)) +
  geom_bar()

Jos määrität lisäksi y-esteettisen ominaisuuden todellisilla arvoilla, tulee määrittää stat = "identity", jotta ggplot2 käyttää annettuja arvoja rivien laskemisen sijaan.

ggplot(data = df, aes(x = category, y = value)) +
  geom_bar(stat = "identity")

Esimerkki: Autojen määrä polttoainetyypeittäin

Pylväsdiagrammia voidaan käyttää näyttämään, kuinka monta autoa on saatavilla kullekin polttoainetyypille. Tässä esimerkissä pylväät täytetään vaaleansinisellä ja reunustetaan punaisella korostuksen vuoksi. Selkeyden vuoksi lisätään otsikot, ja theme_minimal() antaa visuaaliselle ilmeelle selkeyttä.

ggplot(df, aes(x = fuel)) + 
  geom_bar(fill = "lightblue", color = "red") +
  labs(title = "Car Distribution by Fuel Type", 
       x = "Fuel Type", 
       y = "Count") +
  theme_minimal()

Tämä visualisointi korostaa autojen jakautumista eri polttoaineluokkiin, mikä helpottaa niiden suhteellisen saatavuuden vertailua.

question mark

Mitä geom_bar() tekee, kun vain x-muuttuja on annettu?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 2

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

What is the difference between stacked and grouped bar plots?

How do I customize the colors and themes in a bar plot?

Can you explain how to add labels and titles to my bar plots?

Awesome!

Completion rate improved to 4

bookPylväsdiagrammien Luominen

Pyyhkäise näyttääksesi valikon

Miksi käyttää pylväsdiagrammeja?

Pylväsdiagrammit ovat yksi yleisimmistä tavoista visualisoida luokittelu- eli kategorista dataa. Niitä käytetään:

  • Kategorioiden lukumäärien tai frekvenssien vertailuun;
  • Ryhmäkohtaisten yhteenvetojen visualisointiin (esim. polttoainetyyppien keskihinta);
  • Kahden kategorisen muuttujan välisten suhteiden havainnollistamiseen ryhmitellyillä tai pinotuilla pylväillä.

Olipa kyseessä autojen määrä polttoainetyypeittäin tai vaihteistotyyppien vertailu polttoaineiden välillä, pylväsdiagrammit tekevät kategorisista vertailuista selkeitä ja helposti ymmärrettäviä.

Pylväsdiagrammin syntaksi ggplot2:ssa

Pylväsdiagrammi voidaan luoda ggplot2-kirjastolla käyttämällä geom_bar(). Kun määritetään vain x-esteettinen ominaisuus, geom_bar() laskee automaattisesti havaintojen määrän jokaisessa kategoriassa.

ggplot(data = df, aes(x = category)) +
  geom_bar()

Jos määrität lisäksi y-esteettisen ominaisuuden todellisilla arvoilla, tulee määrittää stat = "identity", jotta ggplot2 käyttää annettuja arvoja rivien laskemisen sijaan.

ggplot(data = df, aes(x = category, y = value)) +
  geom_bar(stat = "identity")

Esimerkki: Autojen määrä polttoainetyypeittäin

Pylväsdiagrammia voidaan käyttää näyttämään, kuinka monta autoa on saatavilla kullekin polttoainetyypille. Tässä esimerkissä pylväät täytetään vaaleansinisellä ja reunustetaan punaisella korostuksen vuoksi. Selkeyden vuoksi lisätään otsikot, ja theme_minimal() antaa visuaaliselle ilmeelle selkeyttä.

ggplot(df, aes(x = fuel)) + 
  geom_bar(fill = "lightblue", color = "red") +
  labs(title = "Car Distribution by Fuel Type", 
       x = "Fuel Type", 
       y = "Count") +
  theme_minimal()

Tämä visualisointi korostaa autojen jakautumista eri polttoaineluokkiin, mikä helpottaa niiden suhteellisen saatavuuden vertailua.

question mark

Mitä geom_bar() tekee, kun vain x-muuttuja on annettu?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 2
some-alt