Datavalg - Avancerede Teknikker
Du kender allerede til at vælge enkelte rækker og kolonner ved hjælp af grundlæggende indeksering. Nu er det tid til at gå et skridt videre og udforske, hvordan du vælger flere rækker og kolonner ved hjælp af både base R og dplyr
-pakken. Disse teknikker er essentielle, når du vil fokusere på specifikke dele af et datasæt eller forberede dine data til videre analyse.
Udvælgelse af flere kolonner
Base R
Du kan vælge flere kolonner ved at kombinere deres positioner eller navne med funktionen c()
. Resultatet er en mindre data frame, der kun indeholder de angivne kolonner.
Ved brug af kolonnepositioner:
selected_data_base <- df[, c(1, 2, 3)]
Ved brug af kolonnenavne:
selected_data_base <- df[, c("name", "selling_price", "transmission")]
dplyr
Du kan bruge funktionen select()
og angive kolonnenavnene direkte.
selected_data_dplyr <- df %>%
select(km_driven, fuel, transmission)
Indeksering af enkeltværdier
For at tilgå en specifik værdi, angiv både række- og kolonnenummer. Dette er nyttigt ved kontrol eller fejlfinding af individuelle datapunkter.
df[1, 2] # accesses the value in row 1, column 2
Udskæring af rækker
Nogle gange ønsker du kun at arbejde med de første par rækker eller specifikke rækker ud fra deres position.
Base R
Du kan vælge flere rækker ved at angive det første og sidste indeks og skrive et :
imellem.
first_5_rows_base <- df[1:5, ]
dplyr
Du kan bruge funktionen slice()
og angive det interval af rækker, du ønsker at tage.
first_5_rows_dplyr <- df %>%
slice(1:5)
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 4
Datavalg - Avancerede Teknikker
Stryg for at vise menuen
Du kender allerede til at vælge enkelte rækker og kolonner ved hjælp af grundlæggende indeksering. Nu er det tid til at gå et skridt videre og udforske, hvordan du vælger flere rækker og kolonner ved hjælp af både base R og dplyr
-pakken. Disse teknikker er essentielle, når du vil fokusere på specifikke dele af et datasæt eller forberede dine data til videre analyse.
Udvælgelse af flere kolonner
Base R
Du kan vælge flere kolonner ved at kombinere deres positioner eller navne med funktionen c()
. Resultatet er en mindre data frame, der kun indeholder de angivne kolonner.
Ved brug af kolonnepositioner:
selected_data_base <- df[, c(1, 2, 3)]
Ved brug af kolonnenavne:
selected_data_base <- df[, c("name", "selling_price", "transmission")]
dplyr
Du kan bruge funktionen select()
og angive kolonnenavnene direkte.
selected_data_dplyr <- df %>%
select(km_driven, fuel, transmission)
Indeksering af enkeltværdier
For at tilgå en specifik værdi, angiv både række- og kolonnenummer. Dette er nyttigt ved kontrol eller fejlfinding af individuelle datapunkter.
df[1, 2] # accesses the value in row 1, column 2
Udskæring af rækker
Nogle gange ønsker du kun at arbejde med de første par rækker eller specifikke rækker ud fra deres position.
Base R
Du kan vælge flere rækker ved at angive det første og sidste indeks og skrive et :
imellem.
first_5_rows_base <- df[1:5, ]
dplyr
Du kan bruge funktionen slice()
og angive det interval af rækker, du ønsker at tage.
first_5_rows_dplyr <- df %>%
slice(1:5)
Tak for dine kommentarer!