Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Dataselectie - Basisprincipes | Gegevensmanipulatie en Opschoning
Data-analyse met R

bookDataselectie - Basisprincipes

Zodra je dataset is geladen in R, is het belangrijk te weten hoe je met specifieke delen ervan werkt. Dit houdt in dat je bepaalde rijen en kolommen selecteert waarop je wilt focussen. Of je nu data opschoont of specifieke trends analyseert, efficiënt subselecteren van je data is essentieel.

Dataset laden

Voordat je met data werkt, moet deze worden geladen en bekeken:

library(tidyverse) # load the tidyverse package
df <- read_csv("car_details.csv")  # read the dataset
View(df) # open the dataset in a spreadsheet-style viewer

Rijen selecteren

In R kun je rijen selecteren op hun numerieke positie. Omdat de indexering begint bij 1, geeft df[3, ] de derde rij uit de dataset terug.

df[3, ]

Een kolom selecteren op positie

Net als bij rijen kun je een kolom selecteren met behulp van de numerieke positie. Door de rij-index leeg te laten en de kolom-index op te geven, geeft df[, 5] de vijfde kolom van de dataset terug.

df[, 5]

Een kolom selecteren op naam

Je kunt ook direct toegang krijgen tot een kolom via de naam met de $-operator. Dit biedt een snelle en leesbare manier om een enkele kolom te extraheren. Bijvoorbeeld, df$km_driven selecteert de kolom met de naam km_driven.

view(df$km_driven)
question mark

Welk symbool wordt gebruikt om een kolom op naam te benaderen in base R?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 4

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Suggested prompts:

Can you explain the difference between selecting rows and columns in R?

How do I select multiple rows or columns at once?

What is the advantage of using dplyr over base R for data selection?

Awesome!

Completion rate improved to 4

bookDataselectie - Basisprincipes

Veeg om het menu te tonen

Zodra je dataset is geladen in R, is het belangrijk te weten hoe je met specifieke delen ervan werkt. Dit houdt in dat je bepaalde rijen en kolommen selecteert waarop je wilt focussen. Of je nu data opschoont of specifieke trends analyseert, efficiënt subselecteren van je data is essentieel.

Dataset laden

Voordat je met data werkt, moet deze worden geladen en bekeken:

library(tidyverse) # load the tidyverse package
df <- read_csv("car_details.csv")  # read the dataset
View(df) # open the dataset in a spreadsheet-style viewer

Rijen selecteren

In R kun je rijen selecteren op hun numerieke positie. Omdat de indexering begint bij 1, geeft df[3, ] de derde rij uit de dataset terug.

df[3, ]

Een kolom selecteren op positie

Net als bij rijen kun je een kolom selecteren met behulp van de numerieke positie. Door de rij-index leeg te laten en de kolom-index op te geven, geeft df[, 5] de vijfde kolom van de dataset terug.

df[, 5]

Een kolom selecteren op naam

Je kunt ook direct toegang krijgen tot een kolom via de naam met de $-operator. Dit biedt een snelle en leesbare manier om een enkele kolom te extraheren. Bijvoorbeeld, df$km_driven selecteert de kolom met de naam km_driven.

view(df$km_driven)
question mark

Welk symbool wordt gebruikt om een kolom op naam te benaderen in base R?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 4
some-alt