Datan Valinta – Perusteet
Kun olet ladannut tietoaineiston R:ään, sinun täytyy oppia työskentelemään sen tiettyjen osien kanssa. Tämä tarkoittaa tiettyjen rivien ja sarakkeiden valitsemista, joihin haluat keskittyä. Olitpa sitten puhdistamassa dataa tai analysoimassa tiettyjä trendejä, tehokas tietojen osittaminen on olennaista.
Datan lataaminen
Ennen kuin työskentelet minkään datan kanssa, se täytyy ladata ja tarkastella:
library(tidyverse) # load the tidyverse package
df <- read_csv("car_details.csv") # read the dataset
View(df) # open the dataset in a spreadsheet-style viewer
Rivien valitseminen
R:ssä voit valita rivejä niiden numeerisen sijainnin perusteella. Koska indeksointi alkaa yhdestä, kirjoittamalla df[3, ]
saat tietoaineiston kolmannen rivin.
df[3, ]
Sarakkeen valitseminen sijainnin perusteella
Samoin kuin rivejä, voit valita sarakkeen sen numeerisen sijainnin perusteella. Jättämällä rivin indeksin tyhjäksi ja määrittämällä sarakeindeksin, df[, 5]
palauttaa aineiston viidennen sarakkeen.
df[, 5]
Sarakkeen valitseminen nimen perusteella
Voit myös hakea sarakkeen suoraan sen nimellä käyttämällä $
-operaattoria. Tämä tarjoaa nopean ja selkeän tavan poimia yksittäinen sarake. Esimerkiksi df$km_driven
valitsee sarakkeen nimeltä km_driven.
view(df$km_driven)
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain the difference between selecting rows and columns in R?
How do I select multiple rows or columns at once?
What is the advantage of using dplyr over base R for data selection?
Awesome!
Completion rate improved to 4
Datan Valinta – Perusteet
Pyyhkäise näyttääksesi valikon
Kun olet ladannut tietoaineiston R:ään, sinun täytyy oppia työskentelemään sen tiettyjen osien kanssa. Tämä tarkoittaa tiettyjen rivien ja sarakkeiden valitsemista, joihin haluat keskittyä. Olitpa sitten puhdistamassa dataa tai analysoimassa tiettyjä trendejä, tehokas tietojen osittaminen on olennaista.
Datan lataaminen
Ennen kuin työskentelet minkään datan kanssa, se täytyy ladata ja tarkastella:
library(tidyverse) # load the tidyverse package
df <- read_csv("car_details.csv") # read the dataset
View(df) # open the dataset in a spreadsheet-style viewer
Rivien valitseminen
R:ssä voit valita rivejä niiden numeerisen sijainnin perusteella. Koska indeksointi alkaa yhdestä, kirjoittamalla df[3, ]
saat tietoaineiston kolmannen rivin.
df[3, ]
Sarakkeen valitseminen sijainnin perusteella
Samoin kuin rivejä, voit valita sarakkeen sen numeerisen sijainnin perusteella. Jättämällä rivin indeksin tyhjäksi ja määrittämällä sarakeindeksin, df[, 5]
palauttaa aineiston viidennen sarakkeen.
df[, 5]
Sarakkeen valitseminen nimen perusteella
Voit myös hakea sarakkeen suoraan sen nimellä käyttämällä $
-operaattoria. Tämä tarjoaa nopean ja selkeän tavan poimia yksittäinen sarake. Esimerkiksi df$km_driven
valitsee sarakkeen nimeltä km_driven.
view(df$km_driven)
Kiitos palautteestasi!