Datan Valinta – Perusteet
Pyyhkäise näyttääksesi valikon
Kun tietoaineisto on ladattu R-ympäristöön, on tärkeää osata käsitellä sen tiettyjä osia. Tämä tarkoittaa tiettyjen rivien ja sarakkeiden valitsemista, joihin halutaan keskittyä. Olipa kyseessä datan puhdistus tai tiettyjen trendien analysointi, tehokas aineiston osittaminen on olennaista.
Tietoaineiston lataaminen
Ennen kuin dataa voidaan käsitellä, se täytyy ladata ja tarkastella:
library(tidyverse) # load the tidyverse package
df <- read_csv("car_details.csv") # read the dataset
View(df) # open the dataset in a spreadsheet-style viewer
Rivien valitseminen
R:ssä rivejä voidaan valita niiden numeerisen sijainnin perusteella. Koska indeksointi alkaa yhdestä, komento df[3, ] palauttaa tietoaineiston kolmannen rivin.
df[3, ]
Sarakkeen valitseminen sijainnin perusteella
Samoin kuin rivejä, voit valita sarakkeen sen numeerisen sijainnin perusteella. Jättämällä rivin indeksin tyhjäksi ja määrittämällä sarakkeen indeksin, df[, 5] palauttaa aineiston viidennen sarakkeen.
df[, 5]
Sarakkeen valitseminen nimen perusteella
Voit myös hakea sarakkeen suoraan sen nimellä käyttämällä $-operaattoria. Tämä tarjoaa nopean ja selkeän tavan hakea yksittäinen sarake. Esimerkiksi df$km_driven valitsee sarakkeen nimeltä km_driven.
view(df$km_driven)
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme