Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Gegevensselectie - Geavanceerde Technieken | Gegevensmanipulatie en Opschoning
Data-analyse met R

bookGegevensselectie - Geavanceerde Technieken

Je weet al hoe je afzonderlijke rijen en kolommen selecteert met behulp van basisindexering. Nu is het tijd om een stap verder te gaan en te verkennen hoe je meerdere rijen en kolommen selecteert met zowel base R als het dplyr-pakket. Deze technieken zijn essentieel wanneer je je wilt richten op specifieke delen van een dataset of je gegevens wilt voorbereiden op verdere analyse.

Meerdere kolommen selecteren

Base R

Meerdere kolommen kunnen worden geselecteerd door hun posities of namen te combineren met de functie c(). Het resultaat is een kleinere data frame die alleen de opgegeven kolommen bevat.

Kolomposities gebruiken:

selected_data_base <- df[, c(1, 2, 3)]

Kolomnamen gebruiken:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Gebruik de functie select() en geef de kolomnamen direct door.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indexeren van enkele waarden

Voor toegang tot een specifieke waarde, geef zowel het rij- als kolomnummer op. Dit is nuttig bij het controleren of debuggen van individuele datapunten.

df[1, 2]  # accesses the value in row 1, column 2

Rijen selecteren

Soms is het wenselijk om alleen met de eerste paar rijen te werken, of met specifieke rijen op basis van positie.

Base R

Meerdere rijen selecteren door het eerste en laatste index te specificeren met een : ertussen.

first_5_rows_base <- df[1:5, ]

dplyr

Gebruik de functie slice() en geef het het bereik van de gewenste rijen door.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Wat doet df[1:5, ]?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 5

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Suggested prompts:

Can you explain the difference between selecting columns by position and by name in R?

How does the pipe operator improve code readability in dplyr?

Can you show how to select non-consecutive rows or columns using dplyr?

Awesome!

Completion rate improved to 4

bookGegevensselectie - Geavanceerde Technieken

Veeg om het menu te tonen

Je weet al hoe je afzonderlijke rijen en kolommen selecteert met behulp van basisindexering. Nu is het tijd om een stap verder te gaan en te verkennen hoe je meerdere rijen en kolommen selecteert met zowel base R als het dplyr-pakket. Deze technieken zijn essentieel wanneer je je wilt richten op specifieke delen van een dataset of je gegevens wilt voorbereiden op verdere analyse.

Meerdere kolommen selecteren

Base R

Meerdere kolommen kunnen worden geselecteerd door hun posities of namen te combineren met de functie c(). Het resultaat is een kleinere data frame die alleen de opgegeven kolommen bevat.

Kolomposities gebruiken:

selected_data_base <- df[, c(1, 2, 3)]

Kolomnamen gebruiken:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Gebruik de functie select() en geef de kolomnamen direct door.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indexeren van enkele waarden

Voor toegang tot een specifieke waarde, geef zowel het rij- als kolomnummer op. Dit is nuttig bij het controleren of debuggen van individuele datapunten.

df[1, 2]  # accesses the value in row 1, column 2

Rijen selecteren

Soms is het wenselijk om alleen met de eerste paar rijen te werken, of met specifieke rijen op basis van positie.

Base R

Meerdere rijen selecteren door het eerste en laatste index te specificeren met een : ertussen.

first_5_rows_base <- df[1:5, ]

dplyr

Gebruik de functie slice() en geef het het bereik van de gewenste rijen door.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Wat doet df[1:5, ]?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 5
some-alt