Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Dataselectie - Basisprincipes | Gegevensmanipulatie en Opschoning
Data-analyse met R

Dataselectie - Basisprincipes

Veeg om het menu te tonen

Zodra je dataset is geladen in R, is het belangrijk om te weten hoe je met specifieke delen ervan kunt werken. Dit houdt in dat je bepaalde rijen en kolommen selecteert waarop je je wilt richten. Of je nu data opschoont of specifieke trends analyseert, efficiënt subselecteren van je data is essentieel.

Je dataset laden

Voordat je met data werkt, moet deze worden geladen en bekeken:

library(tidyverse) # load the tidyverse package
df <- read_csv("car_details.csv")  # read the dataset
View(df) # open the dataset in a spreadsheet-style viewer

Rijen selecteren

In R kun je rijen selecteren op basis van hun numerieke positie. Omdat indexering begint bij 1, geeft df[3, ] de derde rij uit de dataset terug.

df[3, ]

Een kolom selecteren op positie

Net als bij rijen kun je een kolom selecteren met behulp van de numerieke positie. Door de rij-index leeg te laten en de kolomindex op te geven, geeft df[, 5] de vijfde kolom van de dataset terug.

df[, 5]

Een kolom selecteren op naam

Je kunt ook direct toegang krijgen tot een kolom via de naam met de $-operator. Dit biedt een snelle en leesbare manier om een enkele kolom te extraheren. Bijvoorbeeld, df$km_driven selecteert de kolom met de naam km_driven.

view(df$km_driven)
question mark

Welk symbool wordt in base R gebruikt om een kolom op naam te benaderen?

Selecteer het correcte antwoord

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 4

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Sectie 1. Hoofdstuk 4
some-alt