Datavalgsprosesser – Avanserte Teknikker
Du kjenner allerede til hvordan du kan velge enkeltstående rader og kolonner ved hjelp av grunnleggende indeksering. Nå er det på tide å gå et steg videre og utforske hvordan du kan velge flere rader og kolonner ved bruk av både base-R og dplyr
-pakken. Disse teknikkene er essensielle når du ønsker å fokusere på bestemte deler av et datasett eller forberede dataene dine for videre analyse.
Velge flere kolonner
Base R
Du kan velge flere kolonner ved å kombinere deres posisjoner eller navn med c()
-funksjonen. Resultatet er en mindre data frame som kun inneholder de spesifiserte kolonnene.
Ved bruk av kolonneposisjoner:
selected_data_base <- df[, c(1, 2, 3)]
Ved bruk av kolonnenavn:
selected_data_base <- df[, c("name", "selling_price", "transmission")]
dplyr
Du kan bruke funksjonen select()
og sende kolonnenavnene direkte.
selected_data_dplyr <- df %>%
select(km_driven, fuel, transmission)
Indeksering av enkeltverdier
For å få tilgang til en spesifikk verdi, oppgi både rad- og kolonnenummer. Dette er nyttig ved kontroll eller feilsøking av individuelle datapunkter.
df[1, 2] # accesses the value in row 1, column 2
Utsnitt av rader
Noen ganger ønsker du kun å arbeide med de første radene, eller spesifikke rader basert på posisjon.
Base R
Du kan velge flere rader ved å angi første og siste indeks og skrive et :
imellom.
first_5_rows_base <- df[1:5, ]
dplyr
Du kan bruke funksjonen slice()
og sende inn området med rader du ønsker å hente.
first_5_rows_dplyr <- df %>%
slice(1:5)
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Can you explain the difference between selecting columns by position and by name in R?
How does the pipe operator improve code readability in dplyr?
Can you show how to select non-consecutive rows or columns using dplyr?
Awesome!
Completion rate improved to 4
Datavalgsprosesser – Avanserte Teknikker
Sveip for å vise menyen
Du kjenner allerede til hvordan du kan velge enkeltstående rader og kolonner ved hjelp av grunnleggende indeksering. Nå er det på tide å gå et steg videre og utforske hvordan du kan velge flere rader og kolonner ved bruk av både base-R og dplyr
-pakken. Disse teknikkene er essensielle når du ønsker å fokusere på bestemte deler av et datasett eller forberede dataene dine for videre analyse.
Velge flere kolonner
Base R
Du kan velge flere kolonner ved å kombinere deres posisjoner eller navn med c()
-funksjonen. Resultatet er en mindre data frame som kun inneholder de spesifiserte kolonnene.
Ved bruk av kolonneposisjoner:
selected_data_base <- df[, c(1, 2, 3)]
Ved bruk av kolonnenavn:
selected_data_base <- df[, c("name", "selling_price", "transmission")]
dplyr
Du kan bruke funksjonen select()
og sende kolonnenavnene direkte.
selected_data_dplyr <- df %>%
select(km_driven, fuel, transmission)
Indeksering av enkeltverdier
For å få tilgang til en spesifikk verdi, oppgi både rad- og kolonnenummer. Dette er nyttig ved kontroll eller feilsøking av individuelle datapunkter.
df[1, 2] # accesses the value in row 1, column 2
Utsnitt av rader
Noen ganger ønsker du kun å arbeide med de første radene, eller spesifikke rader basert på posisjon.
Base R
Du kan velge flere rader ved å angi første og siste indeks og skrive et :
imellom.
first_5_rows_base <- df[1:5, ]
dplyr
Du kan bruke funksjonen slice()
og sende inn området med rader du ønsker å hente.
first_5_rows_dplyr <- df %>%
slice(1:5)
Takk for tilbakemeldingene dine!