Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Pylväsdiagrammien Luominen | Datan Visualisointi
Datan Analysointi R:llä

bookPylväsdiagrammien Luominen

Miksi käyttää pylväsdiagrammeja?

Pylväsdiagrammit ovat yksi yleisimmistä tavoista visualisoida luokittelu- eli kategorista dataa. Niitä käytetään:

  • Kategorioiden lukumäärien tai frekvenssien vertailuun;
  • Ryhmäkohtaisten yhteenvetojen visualisointiin (esim. keskihinta polttoainetyypeittäin);
  • Kahden kategorisen muuttujan välisten suhteiden havainnollistamiseen ryhmitellyillä tai pinotuilla pylväillä.

Olipa kyseessä autojen määrä polttoainetyypeittäin tai vaihteistotyyppien vertailu polttoaineiden välillä, pylväsdiagrammit tekevät kategorisista vertailuista selkeitä ja helposti ymmärrettäviä.

Pylväsdiagrammin syntaksi ggplot2:ssa

Pylväsdiagrammi voidaan luoda ggplot2-kirjastolla käyttämällä geom_bar(). Kun määritetään vain x-esteettisyys, geom_bar() laskee automaattisesti havaintojen määrän jokaisessa kategoriassa.

ggplot(data = df, aes(x = category)) +
  geom_bar()

Jos määritetään myös y-esteettisyys todellisilla arvoilla, tulee asettaa stat = "identity", jotta ggplot2 käyttää annettuja arvoja rivien laskemisen sijaan.

ggplot(data = df, aes(x = category, y = value)) +
  geom_bar(stat = "identity")

Esimerkki: Autojen määrä polttoainetyypeittäin

Pylväsdiagrammia voidaan käyttää näyttämään, kuinka monta autoa on saatavilla eri polttoainetyypeillä. Tässä esimerkissä pylväät täytetään vaaleansinisellä ja reunustetaan punaisella korostuksen vuoksi. Selkeyden lisäämiseksi lisätään otsikot, ja theme_minimal() antaa yksinkertaisemman ulkoasun.

ggplot(df, aes(x = fuel)) + 
  geom_bar(fill = "lightblue", color = "red") +
  labs(title = "Car Distribution by Fuel Type", 
       x = "Fuel Type", 
       y = "Count") +
  theme_minimal()

Tämä visualisointi korostaa autojen jakautumista eri polttoaineluokkiin, mikä helpottaa niiden suhteellisen saatavuuden vertailua.

question mark

Mitä geom_bar() tekee, kun vain x-muuttuja annetaan?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 2

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

What is the difference between stacked and grouped bar plots?

How do I customize the colors and themes in a bar plot?

Can you explain how to add labels and titles to my bar plots?

Awesome!

Completion rate improved to 4

bookPylväsdiagrammien Luominen

Pyyhkäise näyttääksesi valikon

Miksi käyttää pylväsdiagrammeja?

Pylväsdiagrammit ovat yksi yleisimmistä tavoista visualisoida luokittelu- eli kategorista dataa. Niitä käytetään:

  • Kategorioiden lukumäärien tai frekvenssien vertailuun;
  • Ryhmäkohtaisten yhteenvetojen visualisointiin (esim. keskihinta polttoainetyypeittäin);
  • Kahden kategorisen muuttujan välisten suhteiden havainnollistamiseen ryhmitellyillä tai pinotuilla pylväillä.

Olipa kyseessä autojen määrä polttoainetyypeittäin tai vaihteistotyyppien vertailu polttoaineiden välillä, pylväsdiagrammit tekevät kategorisista vertailuista selkeitä ja helposti ymmärrettäviä.

Pylväsdiagrammin syntaksi ggplot2:ssa

Pylväsdiagrammi voidaan luoda ggplot2-kirjastolla käyttämällä geom_bar(). Kun määritetään vain x-esteettisyys, geom_bar() laskee automaattisesti havaintojen määrän jokaisessa kategoriassa.

ggplot(data = df, aes(x = category)) +
  geom_bar()

Jos määritetään myös y-esteettisyys todellisilla arvoilla, tulee asettaa stat = "identity", jotta ggplot2 käyttää annettuja arvoja rivien laskemisen sijaan.

ggplot(data = df, aes(x = category, y = value)) +
  geom_bar(stat = "identity")

Esimerkki: Autojen määrä polttoainetyypeittäin

Pylväsdiagrammia voidaan käyttää näyttämään, kuinka monta autoa on saatavilla eri polttoainetyypeillä. Tässä esimerkissä pylväät täytetään vaaleansinisellä ja reunustetaan punaisella korostuksen vuoksi. Selkeyden lisäämiseksi lisätään otsikot, ja theme_minimal() antaa yksinkertaisemman ulkoasun.

ggplot(df, aes(x = fuel)) + 
  geom_bar(fill = "lightblue", color = "red") +
  labs(title = "Car Distribution by Fuel Type", 
       x = "Fuel Type", 
       y = "Count") +
  theme_minimal()

Tämä visualisointi korostaa autojen jakautumista eri polttoaineluokkiin, mikä helpottaa niiden suhteellisen saatavuuden vertailua.

question mark

Mitä geom_bar() tekee, kun vain x-muuttuja annetaan?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 2
some-alt