Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Datavalgsprosesser – Avanserte Teknikker | Datamanipulering og -rensing
Dataanalyse med R

bookDatavalgsprosesser – Avanserte Teknikker

Du kjenner allerede til hvordan du kan velge enkeltstående rader og kolonner ved hjelp av grunnleggende indeksering. Nå er det på tide å gå et steg videre og utforske hvordan du kan velge flere rader og kolonner ved bruk av både base R og dplyr-pakken. Disse teknikkene er essensielle når du ønsker å fokusere på bestemte deler av et datasett eller forberede dataene dine for videre analyse.

Velge flere kolonner

Base R

Du kan velge flere kolonner ved å kombinere deres posisjoner eller navn med c()-funksjonen. Resultatet er en mindre data frame som kun inneholder de spesifiserte kolonnene.

Ved bruk av kolonneposisjoner:

selected_data_base <- df[, c(1, 2, 3)]

Ved bruk av kolonnenavn:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Du kan bruke funksjonen select() og sende kolonnenavnene direkte.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indeksering av enkeltverdier

For å få tilgang til en spesifikk verdi, oppgi både rad- og kolonnenummer. Dette er nyttig når du skal sjekke eller feilsøke individuelle datapunkter.

df[1, 2]  # accesses the value in row 1, column 2

Utsnitt av rader

Noen ganger ønsker du bare å arbeide med de første radene, eller spesifikke rader basert på posisjon.

Base R

Du kan velge flere rader ved å angi første og siste indeks og skrive et : mellom dem.

first_5_rows_base <- df[1:5, ]

dplyr

Du kan bruke funksjonen slice() og sende inn området av rader du ønsker å hente.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Hva gjør df[1:5, ]?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 5

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Awesome!

Completion rate improved to 4

bookDatavalgsprosesser – Avanserte Teknikker

Sveip for å vise menyen

Du kjenner allerede til hvordan du kan velge enkeltstående rader og kolonner ved hjelp av grunnleggende indeksering. Nå er det på tide å gå et steg videre og utforske hvordan du kan velge flere rader og kolonner ved bruk av både base R og dplyr-pakken. Disse teknikkene er essensielle når du ønsker å fokusere på bestemte deler av et datasett eller forberede dataene dine for videre analyse.

Velge flere kolonner

Base R

Du kan velge flere kolonner ved å kombinere deres posisjoner eller navn med c()-funksjonen. Resultatet er en mindre data frame som kun inneholder de spesifiserte kolonnene.

Ved bruk av kolonneposisjoner:

selected_data_base <- df[, c(1, 2, 3)]

Ved bruk av kolonnenavn:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Du kan bruke funksjonen select() og sende kolonnenavnene direkte.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indeksering av enkeltverdier

For å få tilgang til en spesifikk verdi, oppgi både rad- og kolonnenummer. Dette er nyttig når du skal sjekke eller feilsøke individuelle datapunkter.

df[1, 2]  # accesses the value in row 1, column 2

Utsnitt av rader

Noen ganger ønsker du bare å arbeide med de første radene, eller spesifikke rader basert på posisjon.

Base R

Du kan velge flere rader ved å angi første og siste indeks og skrive et : mellom dem.

first_5_rows_base <- df[1:5, ]

dplyr

Du kan bruke funksjonen slice() og sende inn området av rader du ønsker å hente.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Hva gjør df[1:5, ]?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 5
some-alt