Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Dataval för Avancerade Tekniker | Datamanipulering och Datarensning
Dataanalys med R

bookDataval för Avancerade Tekniker

Du kan redan välja enskilda rader och kolumner med grundläggande indexering. Nu är det dags att gå ett steg längre och utforska hur du väljer flera rader och kolumner med både bas-R och paketet dplyr. Dessa tekniker är avgörande när du vill fokusera på specifika delar av en datamängd eller förbereda dina data för vidare analys.

Välja flera kolumner

Bas-R

Du kan välja flera kolumner genom att kombinera deras positioner eller namn med funktionen c(). Resultatet blir en mindre data frame som endast innehåller de angivna kolumnerna.

Med kolumnpositioner:

selected_data_base <- df[, c(1, 2, 3)]

Med kolumnnamn:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Du kan använda funktionen select() och ange kolumnnamnen direkt.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indexering av enskilda värden

För att komma åt ett specifikt värde, ange både rad- och kolumnnummer. Detta är användbart vid kontroll eller felsökning av enskilda datapunkter.

df[1, 2]  # accesses the value in row 1, column 2

Radutskärning

Ibland vill du bara arbeta med de första raderna, eller specifika rader baserat på position.

Base R

Du kan välja flera rader genom att ange det första och sista indexet och skriva ett : emellan.

first_5_rows_base <- df[1:5, ]

dplyr

Du kan använda funktionen slice() och ange intervallet av rader du vill ta.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Vad gör df[1:5, ]?

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 5

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Suggested prompts:

Can you explain the difference between selecting columns by position and by name in R?

How does the pipe operator improve code readability in dplyr?

Can you show how to select non-consecutive rows or columns using dplyr?

Awesome!

Completion rate improved to 4

bookDataval för Avancerade Tekniker

Svep för att visa menyn

Du kan redan välja enskilda rader och kolumner med grundläggande indexering. Nu är det dags att gå ett steg längre och utforska hur du väljer flera rader och kolumner med både bas-R och paketet dplyr. Dessa tekniker är avgörande när du vill fokusera på specifika delar av en datamängd eller förbereda dina data för vidare analys.

Välja flera kolumner

Bas-R

Du kan välja flera kolumner genom att kombinera deras positioner eller namn med funktionen c(). Resultatet blir en mindre data frame som endast innehåller de angivna kolumnerna.

Med kolumnpositioner:

selected_data_base <- df[, c(1, 2, 3)]

Med kolumnnamn:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Du kan använda funktionen select() och ange kolumnnamnen direkt.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indexering av enskilda värden

För att komma åt ett specifikt värde, ange både rad- och kolumnnummer. Detta är användbart vid kontroll eller felsökning av enskilda datapunkter.

df[1, 2]  # accesses the value in row 1, column 2

Radutskärning

Ibland vill du bara arbeta med de första raderna, eller specifika rader baserat på position.

Base R

Du kan välja flera rader genom att ange det första och sista indexet och skriva ett : emellan.

first_5_rows_base <- df[1:5, ]

dplyr

Du kan använda funktionen slice() och ange intervallet av rader du vill ta.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

Vad gör df[1:5, ]?

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 5
some-alt