Datan Lajittelu
Pyyhkäise näyttääksesi valikon
Järjestäminen on olennainen toimenpide data-analyysissä. Sen avulla voit järjestää tietoaineiston yhden tai useamman muuttujan, kuten hinnan, ajokilometrien tai vuoden, perusteella. Tämä helpottaa trendien, poikkeamien tunnistamista tai yksinkertaisesti datan tarkastelua mielekkäässä järjestyksessä.
Järjestäminen nousevaan järjestykseen
Base R
Voit käyttää order()-funktiota järjestääksesi tietoaineiston sarakkeen arvojen mukaan. Oletuksena funktio palauttaa datan nousevassa järjestyksessä.
df_sorted_price_base <- df[order(df$selling_price), ]
dplyr
Lajittelu voidaan tehdä arrange()-funktiolla, joka oletuksena järjestää nousevaan järjestykseen.
df_sorted_price_dplyr <- df %>%
arrange(selling_price)
Lajittelu laskevaan järjestykseen
Base R
Laskevaan järjestykseen lajitellessa lisätään miinusmerkki (-) sarakkeen eteen order()-funktion sisällä.
df_sorted_price_desc <- df[order(-df$selling_price), ]
dplyr
Voit käyttää desc()-funktiota arrange()-funktion sisällä kääntääksesi järjestyksen.
sorted_price_desc_dplyr <- df %>%
arrange(desc(selling_price))
Lajittelu usean sarakkeen perusteella
On mahdollista lajitella useamman kuin yhden sarakkeen perusteella priorisoidun järjestyksen luomiseksi. Esimerkiksi voit ensin lajitella polttoainetyypin mukaan (aakkosjärjestyksessä) ja sen jälkeen myyntihinnan mukaan laskevassa järjestyksessä.
Base R
df_sorted <- df[order(df$fuel, -df$selling_price), ]
dplyr
df_sorted_dplyr <- df %>%
arrange(fuel, desc(selling_price))
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme