Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Kuvaileva Tilastotiede | Perustason Tilastollinen Analyysi
Datan analysointi R:llä

bookKuvaileva Tilastotiede

Datan ymmärtäminen alkaa kuvailevasta tilastotieteestä – nämä tarjoavat olennaisia yhteenvetoja muuttujien jakaumasta, keskiluvuista ja hajonnasta.

Peruskuvailevat tilastot

Yleisimmät tilastolliset mittarit ovat:

  • Keskiarvo: arvojen keskiarvo;
  • Keskihajonta: kuinka paljon arvot poikkeavat keskiarvosta;
  • Mediaani: keskimmäinen arvo;
  • Min / max: pienimmät ja suurimmat arvot.

Nämä antavat nopean yleiskuvan muuttujien jakaumasta.

Base R

Base R tarjoaa yksinkertaiset funktiot kuvailevien tilastojen laskemiseen. summary()-funktio tuottaa myös nopean tilastollisen yhteenvedon kaikista numeerisista sarakkeista.

mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)

dplyr

dplyr-kirjastolla voit käyttää summarise()-funktiota laskeaksesi useita tilastollisia tunnuslukuja samanaikaisesti selkeässä ja luettavassa muodossa.

df %>%
  summarise(
    avg_power = mean(max_power, na.rm = TRUE),
    sd_power = sd(max_power, na.rm = TRUE),
    median_power = median(max_power, na.rm = TRUE)
  )
question mark

Mitä group_by()-funktio tekee?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 1

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

What is the difference between mean, median, and mode?

Can you explain how to interpret standard deviation and variance?

How do I use dplyr to calculate descriptive statistics for grouped data?

Awesome!

Completion rate improved to 4

bookKuvaileva Tilastotiede

Pyyhkäise näyttääksesi valikon

Datan ymmärtäminen alkaa kuvailevasta tilastotieteestä – nämä tarjoavat olennaisia yhteenvetoja muuttujien jakaumasta, keskiluvuista ja hajonnasta.

Peruskuvailevat tilastot

Yleisimmät tilastolliset mittarit ovat:

  • Keskiarvo: arvojen keskiarvo;
  • Keskihajonta: kuinka paljon arvot poikkeavat keskiarvosta;
  • Mediaani: keskimmäinen arvo;
  • Min / max: pienimmät ja suurimmat arvot.

Nämä antavat nopean yleiskuvan muuttujien jakaumasta.

Base R

Base R tarjoaa yksinkertaiset funktiot kuvailevien tilastojen laskemiseen. summary()-funktio tuottaa myös nopean tilastollisen yhteenvedon kaikista numeerisista sarakkeista.

mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)

dplyr

dplyr-kirjastolla voit käyttää summarise()-funktiota laskeaksesi useita tilastollisia tunnuslukuja samanaikaisesti selkeässä ja luettavassa muodossa.

df %>%
  summarise(
    avg_power = mean(max_power, na.rm = TRUE),
    sd_power = sd(max_power, na.rm = TRUE),
    median_power = median(max_power, na.rm = TRUE)
  )
question mark

Mitä group_by()-funktio tekee?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 1
some-alt