Dataval för Avancerade Tekniker
Du kan redan välja enskilda rader och kolumner med grundläggande indexering. Nu är det dags att gå ett steg längre och utforska hur du väljer flera rader och kolumner med både bas-R och paketet dplyr
. Dessa tekniker är avgörande när du vill fokusera på specifika delar av en datamängd eller förbereda dina data för vidare analys.
Välja flera kolumner
Bas-R
Du kan välja flera kolumner genom att kombinera deras positioner eller namn med funktionen c()
. Resultatet blir en mindre data frame som endast innehåller de angivna kolumnerna.
Med kolumnpositioner:
selected_data_base <- df[, c(1, 2, 3)]
Med kolumnnamn:
selected_data_base <- df[, c("name", "selling_price", "transmission")]
dplyr
Du kan använda funktionen select()
och ange kolumnnamnen direkt.
selected_data_dplyr <- df %>%
select(km_driven, fuel, transmission)
Indexering av enskilda värden
För att komma åt ett specifikt värde, ange både rad- och kolumnnummer. Detta är användbart vid kontroll eller felsökning av enskilda datapunkter.
df[1, 2] # accesses the value in row 1, column 2
Radutskärning
Ibland vill du bara arbeta med de första raderna, eller specifika rader baserat på position.
Base R
Du kan välja flera rader genom att ange det första och sista indexet och skriva ett :
emellan.
first_5_rows_base <- df[1:5, ]
dplyr
Du kan använda funktionen slice()
och ange intervallet av rader du vill ta.
first_5_rows_dplyr <- df %>%
slice(1:5)
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Can you explain the difference between selecting columns by position and by name in R?
How does the pipe operator improve code readability in dplyr?
Can you show how to select non-consecutive rows or columns using dplyr?
Awesome!
Completion rate improved to 4
Dataval för Avancerade Tekniker
Svep för att visa menyn
Du kan redan välja enskilda rader och kolumner med grundläggande indexering. Nu är det dags att gå ett steg längre och utforska hur du väljer flera rader och kolumner med både bas-R och paketet dplyr
. Dessa tekniker är avgörande när du vill fokusera på specifika delar av en datamängd eller förbereda dina data för vidare analys.
Välja flera kolumner
Bas-R
Du kan välja flera kolumner genom att kombinera deras positioner eller namn med funktionen c()
. Resultatet blir en mindre data frame som endast innehåller de angivna kolumnerna.
Med kolumnpositioner:
selected_data_base <- df[, c(1, 2, 3)]
Med kolumnnamn:
selected_data_base <- df[, c("name", "selling_price", "transmission")]
dplyr
Du kan använda funktionen select()
och ange kolumnnamnen direkt.
selected_data_dplyr <- df %>%
select(km_driven, fuel, transmission)
Indexering av enskilda värden
För att komma åt ett specifikt värde, ange både rad- och kolumnnummer. Detta är användbart vid kontroll eller felsökning av enskilda datapunkter.
df[1, 2] # accesses the value in row 1, column 2
Radutskärning
Ibland vill du bara arbeta med de första raderna, eller specifika rader baserat på position.
Base R
Du kan välja flera rader genom att ange det första och sista indexet och skriva ett :
emellan.
first_5_rows_base <- df[1:5, ]
dplyr
Du kan använda funktionen slice()
och ange intervallet av rader du vill ta.
first_5_rows_dplyr <- df %>%
slice(1:5)
Tack för dina kommentarer!