Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Datan Suodatus – Perusehdot | Datan Käsittely ja Puhdistus
Datan analysointi R:llä

bookDatan Suodatus – Perusehdot

Suodatus on tehokas tekniikka, jonka avulla voidaan rajata tietueita, jotka täyttävät tietyt ehdot – kuten valitsemalla vain dieselautot, kalliit autot tai ajoneuvot, joissa on manuaalivaihteisto. Tämä mahdollistaa keskittymisen olennaiseen dataan syvällisempää analyysiä, raportointia tai visualisointia varten.

Suodatus kategorian perusteella

Base R

Rivejä voidaan suodattaa asettamalla ehto tietylle sarakkeelle. Esimerkiksi, jos halutaan valita vain autot, joiden polttoainetyyppi on Diesel, käytetään $-operaattoria sarakkeen viittaamiseen ja loogisen ehdon asettamiseen.

diesel_cars <- df[df$fuel == "Diesel", ]

dplyr

Voit käyttää filter()-funktiota ja antaa ehdon suoraan.

diesel_cars_dplyr <- df %>%    
  filter(fuel == "Diesel")

Suodatus numeerisen arvon perusteella

Voit myös suodattaa dataa numeeristen vertailujen avulla.

Base R

expensive_cars <- df[df$selling_price > 500000, ]

dplyr

cheap_cars_dplyr <- df %>%
  filter(selling_price < 500000)

Useita ehtoja

Base R

Ehtoja voidaan yhdistää käyttämällä loogisia operaattoreita, kuten & (JA).

diesel_manual_cars <- df[df$fuel == "Diesel" & df$transmission == "Manual", ]

dplyr

Voit antaa useita ehtoja filter()-funktiolle, erotettuna pilkulla.

diesel_manual_cars_dplyr <- df %>%
  filter(fuel == "Diesel", transmission == "Manual")
question mark

nrow() käytetään seuraavaan:

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 6

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain the difference between filtering with base R and dplyr?

How do I filter data using multiple conditions?

What are some common mistakes to avoid when filtering data in R?

Awesome!

Completion rate improved to 4

bookDatan Suodatus – Perusehdot

Pyyhkäise näyttääksesi valikon

Suodatus on tehokas tekniikka, jonka avulla voidaan rajata tietueita, jotka täyttävät tietyt ehdot – kuten valitsemalla vain dieselautot, kalliit autot tai ajoneuvot, joissa on manuaalivaihteisto. Tämä mahdollistaa keskittymisen olennaiseen dataan syvällisempää analyysiä, raportointia tai visualisointia varten.

Suodatus kategorian perusteella

Base R

Rivejä voidaan suodattaa asettamalla ehto tietylle sarakkeelle. Esimerkiksi, jos halutaan valita vain autot, joiden polttoainetyyppi on Diesel, käytetään $-operaattoria sarakkeen viittaamiseen ja loogisen ehdon asettamiseen.

diesel_cars <- df[df$fuel == "Diesel", ]

dplyr

Voit käyttää filter()-funktiota ja antaa ehdon suoraan.

diesel_cars_dplyr <- df %>%    
  filter(fuel == "Diesel")

Suodatus numeerisen arvon perusteella

Voit myös suodattaa dataa numeeristen vertailujen avulla.

Base R

expensive_cars <- df[df$selling_price > 500000, ]

dplyr

cheap_cars_dplyr <- df %>%
  filter(selling_price < 500000)

Useita ehtoja

Base R

Ehtoja voidaan yhdistää käyttämällä loogisia operaattoreita, kuten & (JA).

diesel_manual_cars <- df[df$fuel == "Diesel" & df$transmission == "Manual", ]

dplyr

Voit antaa useita ehtoja filter()-funktiolle, erotettuna pilkulla.

diesel_manual_cars_dplyr <- df %>%
  filter(fuel == "Diesel", transmission == "Manual")
question mark

nrow() käytetään seuraavaan:

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 6
some-alt