Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Gegevensselectie - Geavanceerde Technieken | Gegevensmanipulatie en Opschoning
Data-analyse met R

bookGegevensselectie - Geavanceerde Technieken

Je weet al hoe je enkele rijen en kolommen selecteert met behulp van basisindexering. Nu is het tijd om een stap verder te gaan en te verkennen hoe je meerdere rijen en kolommen selecteert met zowel base R als het dplyr-pakket. Deze technieken zijn essentieel wanneer je je wilt richten op specifieke delen van een dataset of je data wilt voorbereiden voor verdere analyse.

Meerdere kolommen selecteren

Base R

Meerdere kolommen kunnen worden geselecteerd door hun posities of namen te combineren met de c()-functie. Het resultaat is een kleinere data frame die alleen de opgegeven kolommen bevat.

Gebruik van kolomposities:

selected_data_base <- df[, c(1, 2, 3)]

Gebruik van kolomnamen:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Gebruik de functie select() en geef de kolomnamen direct door.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indexeren van enkele waarden

Om een specifieke waarde te benaderen, geef zowel het rij- als kolomnummer op. Dit is nuttig bij het controleren of debuggen van individuele datapunten.

df[1, 2]  # accesses the value in row 1, column 2

Rijen selecteren

Soms is het wenselijk om alleen met de eerste paar rijen te werken, of met specifieke rijen op basis van hun positie.

Base R

Meerdere rijen selecteren door het eerste en laatste index te specificeren en een : ertussen te plaatsen.

first_5_rows_base <- df[1:5, ]

dplyr

Gebruik de functie slice() en geef het het bereik van de gewenste rijen door.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Wat doet df[1:5, ]?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 5

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Awesome!

Completion rate improved to 4

bookGegevensselectie - Geavanceerde Technieken

Veeg om het menu te tonen

Je weet al hoe je enkele rijen en kolommen selecteert met behulp van basisindexering. Nu is het tijd om een stap verder te gaan en te verkennen hoe je meerdere rijen en kolommen selecteert met zowel base R als het dplyr-pakket. Deze technieken zijn essentieel wanneer je je wilt richten op specifieke delen van een dataset of je data wilt voorbereiden voor verdere analyse.

Meerdere kolommen selecteren

Base R

Meerdere kolommen kunnen worden geselecteerd door hun posities of namen te combineren met de c()-functie. Het resultaat is een kleinere data frame die alleen de opgegeven kolommen bevat.

Gebruik van kolomposities:

selected_data_base <- df[, c(1, 2, 3)]

Gebruik van kolomnamen:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Gebruik de functie select() en geef de kolomnamen direct door.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indexeren van enkele waarden

Om een specifieke waarde te benaderen, geef zowel het rij- als kolomnummer op. Dit is nuttig bij het controleren of debuggen van individuele datapunten.

df[1, 2]  # accesses the value in row 1, column 2

Rijen selecteren

Soms is het wenselijk om alleen met de eerste paar rijen te werken, of met specifieke rijen op basis van hun positie.

Base R

Meerdere rijen selecteren door het eerste en laatste index te specificeren en een : ertussen te plaatsen.

first_5_rows_base <- df[1:5, ]

dplyr

Gebruik de functie slice() en geef het het bereik van de gewenste rijen door.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Wat doet df[1:5, ]?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 5
some-alt