Dataval av Avancerade Tekniker
Svep för att visa menyn
Du kan redan välja enskilda rader och kolumner med grundläggande indexering. Nu är det dags att gå ett steg längre och utforska hur du väljer flera rader och kolumner med både bas-R och paketet dplyr. Dessa tekniker är viktiga när du vill fokusera på specifika delar av en datamängd eller förbereda dina data för vidare analys.
Välja flera kolumner
Base R
Du kan välja flera kolumner genom att kombinera deras positioner eller namn med funktionen c(). Resultatet blir en mindre data frame som endast innehåller de angivna kolumnerna.
Med kolumnpositioner:
selected_data_base <- df[, c(1, 2, 3)]
Med kolumnnamn:
selected_data_base <- df[, c("name", "selling_price", "transmission")]
dplyr
Du kan använda funktionen select() och ange kolumnnamnen direkt.
selected_data_dplyr <- df %>%
select(km_driven, fuel, transmission)
Indexering av enskilda värden
För att komma åt ett specifikt värde, ange både rad- och kolumnnummer. Detta är användbart vid kontroll eller felsökning av enskilda datapunkter.
df[1, 2] # accesses the value in row 1, column 2
Radskivning
Ibland vill du bara arbeta med de första raderna, eller specifika rader baserat på position.
Base R
Du kan välja flera rader genom att ange det första och sista indexet och skriva ett : emellan.
first_5_rows_base <- df[1:5, ]
dplyr
Du kan använda funktionen slice() och ange intervallet av rader du vill ta.
first_5_rows_dplyr <- df %>%
slice(1:5)
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal