Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Datavalg - Avancerede Teknikker | Datamanipulation og -Rensning
Dataanalyse med R

bookDatavalg - Avancerede Teknikker

Du ved allerede, hvordan man vælger enkelte rækker og kolonner ved hjælp af grundlæggende indeksering. Nu er det tid til at gå et skridt videre og udforske, hvordan man vælger flere rækker og kolonner ved hjælp af både base R og dplyr-pakken. Disse teknikker er essentielle, når du ønsker at fokusere på specifikke dele af et datasæt eller forberede dine data til videre analyse.

Valg af flere kolonner

Base R

Du kan vælge flere kolonner ved at kombinere deres positioner eller navne med funktionen c(). Resultatet er en mindre data frame, der kun indeholder de angivne kolonner.

Ved brug af kolonnepositioner:

selected_data_base <- df[, c(1, 2, 3)]

Ved brug af kolonnenavne:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Du kan bruge funktionen select() og angive kolonnenavnene direkte.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indeksering af enkeltværdier

For at tilgå en specifik værdi, angiv både række- og kolonnenummer. Dette er nyttigt ved kontrol eller fejlfinding af individuelle datapunkter.

df[1, 2]  # accesses the value in row 1, column 2

Udskæring af rækker

Nogle gange ønskes kun arbejde med de første par rækker eller specifikke rækker ud fra position.

Base R

Du kan vælge flere rækker ved at angive det første og sidste indeks og skrive et : imellem.

first_5_rows_base <- df[1:5, ]

dplyr

Du kan bruge funktionen slice() og give den det interval af rækker, du ønsker at tage.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Hvad gør df[1:5, ]?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 5

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Awesome!

Completion rate improved to 4

bookDatavalg - Avancerede Teknikker

Stryg for at vise menuen

Du ved allerede, hvordan man vælger enkelte rækker og kolonner ved hjælp af grundlæggende indeksering. Nu er det tid til at gå et skridt videre og udforske, hvordan man vælger flere rækker og kolonner ved hjælp af både base R og dplyr-pakken. Disse teknikker er essentielle, når du ønsker at fokusere på specifikke dele af et datasæt eller forberede dine data til videre analyse.

Valg af flere kolonner

Base R

Du kan vælge flere kolonner ved at kombinere deres positioner eller navne med funktionen c(). Resultatet er en mindre data frame, der kun indeholder de angivne kolonner.

Ved brug af kolonnepositioner:

selected_data_base <- df[, c(1, 2, 3)]

Ved brug af kolonnenavne:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Du kan bruge funktionen select() og angive kolonnenavnene direkte.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indeksering af enkeltværdier

For at tilgå en specifik værdi, angiv både række- og kolonnenummer. Dette er nyttigt ved kontrol eller fejlfinding af individuelle datapunkter.

df[1, 2]  # accesses the value in row 1, column 2

Udskæring af rækker

Nogle gange ønskes kun arbejde med de første par rækker eller specifikke rækker ud fra position.

Base R

Du kan vælge flere rækker ved at angive det første og sidste indeks og skrive et : imellem.

first_5_rows_base <- df[1:5, ]

dplyr

Du kan bruge funktionen slice() og give den det interval af rækker, du ønsker at tage.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Hvad gør df[1:5, ]?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 5
some-alt