Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Gegevens Filteren - Basisvoorwaarden | Gegevensmanipulatie en Opschoning
Data-analyse met R

bookGegevens Filteren - Basisvoorwaarden

Filteren is een krachtige techniek waarmee je rijen met gegevens kunt isoleren die aan bepaalde criteria voldoen - zoals alleen dieselauto's selecteren, dure auto's, of voertuigen met een handgeschakelde transmissie. Het helpt je te focussen op relevante gegevens voor diepgaandere analyse, rapportage of visualisatie.

Filteren op categorie

Base R

Je kunt rijen filteren door een voorwaarde toe te passen op een specifieke kolom. Bijvoorbeeld, om alleen de auto's te selecteren waarbij het brandstoftype Diesel is, gebruik je de $-operator om naar de kolom te verwijzen en een logische voorwaarde toe te passen.

diesel_cars <- df[df$fuel == "Diesel", ]

dplyr

Gebruik de functie filter() en geef de voorwaarde direct door.

diesel_cars_dplyr <- df %>%    
  filter(fuel == "Diesel")

Filteren op Numerieke Waarde

Het is ook mogelijk om gegevens te filteren met behulp van numerieke vergelijkingen.

Base R

expensive_cars <- df[df$selling_price > 500000, ]

dplyr

cheap_cars_dplyr <- df %>%
  filter(selling_price < 500000)

Meerdere voorwaarden

Base R

Voorwaarden combineren met logische operatoren zoals & voor EN.

diesel_manual_cars <- df[df$fuel == "Diesel" & df$transmission == "Manual", ]

dplyr

Meerdere voorwaarden kunnen aan de functie filter() worden doorgegeven, gescheiden door een komma.

diesel_manual_cars_dplyr <- df %>%
  filter(fuel == "Diesel", transmission == "Manual")
question mark

nrow() wordt gebruikt om:

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 6

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Suggested prompts:

Can you explain the difference between filtering with base R and dplyr?

How do I filter data using multiple conditions?

What are some common mistakes to avoid when filtering data in R?

Awesome!

Completion rate improved to 4

bookGegevens Filteren - Basisvoorwaarden

Veeg om het menu te tonen

Filteren is een krachtige techniek waarmee je rijen met gegevens kunt isoleren die aan bepaalde criteria voldoen - zoals alleen dieselauto's selecteren, dure auto's, of voertuigen met een handgeschakelde transmissie. Het helpt je te focussen op relevante gegevens voor diepgaandere analyse, rapportage of visualisatie.

Filteren op categorie

Base R

Je kunt rijen filteren door een voorwaarde toe te passen op een specifieke kolom. Bijvoorbeeld, om alleen de auto's te selecteren waarbij het brandstoftype Diesel is, gebruik je de $-operator om naar de kolom te verwijzen en een logische voorwaarde toe te passen.

diesel_cars <- df[df$fuel == "Diesel", ]

dplyr

Gebruik de functie filter() en geef de voorwaarde direct door.

diesel_cars_dplyr <- df %>%    
  filter(fuel == "Diesel")

Filteren op Numerieke Waarde

Het is ook mogelijk om gegevens te filteren met behulp van numerieke vergelijkingen.

Base R

expensive_cars <- df[df$selling_price > 500000, ]

dplyr

cheap_cars_dplyr <- df %>%
  filter(selling_price < 500000)

Meerdere voorwaarden

Base R

Voorwaarden combineren met logische operatoren zoals & voor EN.

diesel_manual_cars <- df[df$fuel == "Diesel" & df$transmission == "Manual", ]

dplyr

Meerdere voorwaarden kunnen aan de functie filter() worden doorgegeven, gescheiden door een komma.

diesel_manual_cars_dplyr <- df %>%
  filter(fuel == "Diesel", transmission == "Manual")
question mark

nrow() wordt gebruikt om:

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 6
some-alt