Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Histogrammien Luominen | Datan Visualisointi
Quizzes & Challenges
Quizzes
Challenges
/
Datan Analysointi R:llä

bookHistogrammien Luominen

Miksi käyttää histogrammeja?

Histogrammit havainnollistavat jatkuvan (numeerisen) datan jakaumaa. Ne näyttävät, miten data jakautuu alueisiin (luokkiin) ja auttavat:

  • Havaitsemaan vinouman, poikkeavat arvot tai aukot;
  • Ymmärtämään frekvenssijakauman;
  • Arvioimaan nopeasti, onko data normaalijakautunutta vai ei.

Parhaiten soveltuvat muuttujille kuten hinta, ajokilometrit tai ikä.

Histogrammin syntaksi ggplot2:ssa

Histogrammin voi luoda käyttämällä geom_histogram(), jossa x-muuttujan tulee olla numeerinen.

ggplot(data = df, aes(x = variable)) +
  geom_histogram()

Histogrammin ulkoasua voi muokata argumenteilla kuten bins (luokkien määrä), fill (palkkien väri), color (reunojen väri) ja theme tyylin määrittelyyn.

Esimerkki: Myyntihintojen jakauma

Histogrammia voidaan käyttää tarkastelemaan, miten automyyntihinnat jakautuvat aineistossa. Tässä esimerkissä palkit täytetään teräksen sinisellä ja reunustetaan mustalla, ja selkeyden vuoksi lisätään otsikot sekä minimaalinen teema.

ggplot(data = df, aes(x = selling_price)) +
  geom_histogram(fill = "steelblue", color = "black") +
  labs(title = "Distribution of Selling Prices",
       x = "Selling Price (in PKR)",
       y = "Count") +
  theme_minimal()

Tämä kuvaaja paljastaa myyntihintojen jakauman yleisen muodon, jolloin on helppo nähdä, sijoittuvatko suurin osa autoista tietylle hintavälille vai esiintyykö poikkeavia arvoja ylä- tai alapäässä.

question mark

Mitä geom_histogram()-funktion bins-parametri ohjaa?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 3

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain the difference between a histogram and a bar plot?

How do I choose the right number of bins for my histogram?

What does it mean if my histogram is skewed to the right or left?

bookHistogrammien Luominen

Pyyhkäise näyttääksesi valikon

Miksi käyttää histogrammeja?

Histogrammit havainnollistavat jatkuvan (numeerisen) datan jakaumaa. Ne näyttävät, miten data jakautuu alueisiin (luokkiin) ja auttavat:

  • Havaitsemaan vinouman, poikkeavat arvot tai aukot;
  • Ymmärtämään frekvenssijakauman;
  • Arvioimaan nopeasti, onko data normaalijakautunutta vai ei.

Parhaiten soveltuvat muuttujille kuten hinta, ajokilometrit tai ikä.

Histogrammin syntaksi ggplot2:ssa

Histogrammin voi luoda käyttämällä geom_histogram(), jossa x-muuttujan tulee olla numeerinen.

ggplot(data = df, aes(x = variable)) +
  geom_histogram()

Histogrammin ulkoasua voi muokata argumenteilla kuten bins (luokkien määrä), fill (palkkien väri), color (reunojen väri) ja theme tyylin määrittelyyn.

Esimerkki: Myyntihintojen jakauma

Histogrammia voidaan käyttää tarkastelemaan, miten automyyntihinnat jakautuvat aineistossa. Tässä esimerkissä palkit täytetään teräksen sinisellä ja reunustetaan mustalla, ja selkeyden vuoksi lisätään otsikot sekä minimaalinen teema.

ggplot(data = df, aes(x = selling_price)) +
  geom_histogram(fill = "steelblue", color = "black") +
  labs(title = "Distribution of Selling Prices",
       x = "Selling Price (in PKR)",
       y = "Count") +
  theme_minimal()

Tämä kuvaaja paljastaa myyntihintojen jakauman yleisen muodon, jolloin on helppo nähdä, sijoittuvatko suurin osa autoista tietylle hintavälille vai esiintyykö poikkeavia arvoja ylä- tai alapäässä.

question mark

Mitä geom_histogram()-funktion bins-parametri ohjaa?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 3
some-alt