Gegevensselectie - Geavanceerde Technieken
Je weet al hoe je enkele rijen en kolommen selecteert met behulp van basisindexering. Nu is het tijd om een stap verder te gaan en te verkennen hoe je meerdere rijen en kolommen selecteert met zowel base R als het dplyr
-pakket. Deze technieken zijn essentieel wanneer je je wilt richten op specifieke delen van een dataset of je data wilt voorbereiden voor verdere analyse.
Meerdere kolommen selecteren
Base R
Meerdere kolommen kunnen worden geselecteerd door hun posities of namen te combineren met de c()
-functie. Het resultaat is een kleinere data frame die alleen de opgegeven kolommen bevat.
Gebruik van kolomposities:
selected_data_base <- df[, c(1, 2, 3)]
Gebruik van kolomnamen:
selected_data_base <- df[, c("name", "selling_price", "transmission")]
dplyr
Gebruik de functie select()
en geef de kolomnamen direct door.
selected_data_dplyr <- df %>%
select(km_driven, fuel, transmission)
Indexeren van enkele waarden
Om een specifieke waarde te benaderen, geef zowel het rij- als kolomnummer op. Dit is nuttig bij het controleren of debuggen van individuele datapunten.
df[1, 2] # accesses the value in row 1, column 2
Rijen selecteren
Soms is het wenselijk om alleen met de eerste paar rijen te werken, of met specifieke rijen op basis van hun positie.
Base R
Meerdere rijen selecteren door het eerste en laatste index te specificeren en een :
ertussen te plaatsen.
first_5_rows_base <- df[1:5, ]
dplyr
Gebruik de functie slice()
en geef het het bereik van de gewenste rijen door.
first_5_rows_dplyr <- df %>%
slice(1:5)
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 4
Gegevensselectie - Geavanceerde Technieken
Veeg om het menu te tonen
Je weet al hoe je enkele rijen en kolommen selecteert met behulp van basisindexering. Nu is het tijd om een stap verder te gaan en te verkennen hoe je meerdere rijen en kolommen selecteert met zowel base R als het dplyr
-pakket. Deze technieken zijn essentieel wanneer je je wilt richten op specifieke delen van een dataset of je data wilt voorbereiden voor verdere analyse.
Meerdere kolommen selecteren
Base R
Meerdere kolommen kunnen worden geselecteerd door hun posities of namen te combineren met de c()
-functie. Het resultaat is een kleinere data frame die alleen de opgegeven kolommen bevat.
Gebruik van kolomposities:
selected_data_base <- df[, c(1, 2, 3)]
Gebruik van kolomnamen:
selected_data_base <- df[, c("name", "selling_price", "transmission")]
dplyr
Gebruik de functie select()
en geef de kolomnamen direct door.
selected_data_dplyr <- df %>%
select(km_driven, fuel, transmission)
Indexeren van enkele waarden
Om een specifieke waarde te benaderen, geef zowel het rij- als kolomnummer op. Dit is nuttig bij het controleren of debuggen van individuele datapunten.
df[1, 2] # accesses the value in row 1, column 2
Rijen selecteren
Soms is het wenselijk om alleen met de eerste paar rijen te werken, of met specifieke rijen op basis van hun positie.
Base R
Meerdere rijen selecteren door het eerste en laatste index te specificeren en een :
ertussen te plaatsen.
first_5_rows_base <- df[1:5, ]
dplyr
Gebruik de functie slice()
en geef het het bereik van de gewenste rijen door.
first_5_rows_dplyr <- df %>%
slice(1:5)
Bedankt voor je feedback!