Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Datavalg - Avancerede Teknikker | Datamanipulation og -Rensning
Dataanalyse med R

bookDatavalg - Avancerede Teknikker

Du kender allerede til at vælge enkelte rækker og kolonner ved hjælp af grundlæggende indeksering. Nu er det tid til at gå et skridt videre og udforske, hvordan du vælger flere rækker og kolonner ved hjælp af både base R og dplyr-pakken. Disse teknikker er essentielle, når du vil fokusere på specifikke dele af et datasæt eller forberede dine data til videre analyse.

Udvælgelse af flere kolonner

Base R

Du kan vælge flere kolonner ved at kombinere deres positioner eller navne med funktionen c(). Resultatet er en mindre data frame, der kun indeholder de angivne kolonner.

Ved brug af kolonnepositioner:

selected_data_base <- df[, c(1, 2, 3)]

Ved brug af kolonnenavne:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Du kan bruge funktionen select() og angive kolonnenavnene direkte.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indeksering af enkeltværdier

For at tilgå en specifik værdi, angiv både række- og kolonnenummer. Dette er nyttigt ved kontrol eller fejlfinding af individuelle datapunkter.

df[1, 2]  # accesses the value in row 1, column 2

Udskæring af rækker

Nogle gange ønsker du kun at arbejde med de første par rækker eller specifikke rækker ud fra deres position.

Base R

Du kan vælge flere rækker ved at angive det første og sidste indeks og skrive et : imellem.

first_5_rows_base <- df[1:5, ]

dplyr

Du kan bruge funktionen slice() og angive det interval af rækker, du ønsker at tage.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Hvad gør df[1:5, ]?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 5

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Awesome!

Completion rate improved to 4

bookDatavalg - Avancerede Teknikker

Stryg for at vise menuen

Du kender allerede til at vælge enkelte rækker og kolonner ved hjælp af grundlæggende indeksering. Nu er det tid til at gå et skridt videre og udforske, hvordan du vælger flere rækker og kolonner ved hjælp af både base R og dplyr-pakken. Disse teknikker er essentielle, når du vil fokusere på specifikke dele af et datasæt eller forberede dine data til videre analyse.

Udvælgelse af flere kolonner

Base R

Du kan vælge flere kolonner ved at kombinere deres positioner eller navne med funktionen c(). Resultatet er en mindre data frame, der kun indeholder de angivne kolonner.

Ved brug af kolonnepositioner:

selected_data_base <- df[, c(1, 2, 3)]

Ved brug af kolonnenavne:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Du kan bruge funktionen select() og angive kolonnenavnene direkte.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indeksering af enkeltværdier

For at tilgå en specifik værdi, angiv både række- og kolonnenummer. Dette er nyttigt ved kontrol eller fejlfinding af individuelle datapunkter.

df[1, 2]  # accesses the value in row 1, column 2

Udskæring af rækker

Nogle gange ønsker du kun at arbejde med de første par rækker eller specifikke rækker ud fra deres position.

Base R

Du kan vælge flere rækker ved at angive det første og sidste indeks og skrive et : imellem.

first_5_rows_base <- df[1:5, ]

dplyr

Du kan bruge funktionen slice() og angive det interval af rækker, du ønsker at tage.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Hvad gør df[1:5, ]?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 5
some-alt