Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Datan Suodatus – Perusehdot | Datan Käsittely ja Puhdistus
Datan Analysointi R:llä

Datan Suodatus – Perusehdot

Pyyhkäise näyttääksesi valikon

Suodatus on tehokas tekniikka, jonka avulla voidaan erotella ne rivit, jotka täyttävät tietyt ehdot – kuten valitsemalla vain dieselautot, kalliit autot tai manuaalivaihteiset ajoneuvot. Tämä auttaa keskittymään olennaiseen dataan syvällisempää analyysiä, raportointia tai visualisointia varten.

Suodatus kategorian mukaan

Base R

Rivejä voidaan suodattaa asettamalla ehto tietylle sarakkeelle. Esimerkiksi, jos halutaan valita vain ne autot, joiden polttoainetyyppi on Diesel, käytetään $-operaattoria sarakkeen viittaamiseen ja loogisen ehdon asettamiseen.

diesel_cars <- df[df$fuel == "Diesel", ]

dplyr

Voit käyttää filter()-funktiota ja välittää ehdon suoraan.

diesel_cars_dplyr <- df %>%    
  filter(fuel == "Diesel")

Suodatus numeerisen arvon perusteella

Tietoja voidaan suodattaa myös numeeristen vertailujen avulla.

Base R

expensive_cars <- df[df$selling_price > 500000, ]

dplyr

cheap_cars_dplyr <- df %>%
  filter(selling_price < 500000)

Useita ehtoja

Base R

Ehtoja voidaan yhdistää loogisilla operaattoreilla, kuten & (JA).

diesel_manual_cars <- df[df$fuel == "Diesel" & df$transmission == "Manual", ]

dplyr

Voit antaa useita ehtoja filter()-funktiolle, erotettuna pilkulla.

diesel_manual_cars_dplyr <- df %>%
  filter(fuel == "Diesel", transmission == "Manual")
question mark

nrow() käytetään seuraavaan:

Valitse oikea vastaus

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 6

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Osio 1. Luku 6
some-alt