Selección de Datos - Técnicas Avanzadas
Desliza para mostrar el menú
Ya sabes cómo seleccionar filas y columnas individuales utilizando la indexación básica. Ahora es momento de ir un paso más allá y explorar cómo seleccionar múltiples filas y columnas utilizando tanto R base como el paquete dplyr. Estas técnicas son esenciales cuando se desea enfocar en partes específicas de un conjunto de datos o preparar los datos para un análisis posterior.
Selección de múltiples columnas
R base
Es posible seleccionar múltiples columnas combinando sus posiciones o nombres con la función c(). El resultado es un data frame más pequeño que contiene solo las columnas especificadas.
Usando posiciones de columnas:
selected_data_base <- df[, c(1, 2, 3)]
Usando nombres de columnas:
selected_data_base <- df[, c("name", "selling_price", "transmission")]
dplyr
Puedes utilizar la función select() y pasar directamente los nombres de las columnas.
selected_data_dplyr <- df %>%
select(km_driven, fuel, transmission)
Indexación de valores individuales
Para acceder a un valor específico, proporciona tanto el número de fila como el de columna. Esto es útil al revisar o depurar puntos de datos individuales.
df[1, 2] # accesses the value in row 1, column 2
Segmentación de filas
A veces solo se desea trabajar con las primeras filas o con filas específicas por posición.
Base R
Puedes seleccionar varias filas especificando el primer y el último índice y escribiendo un : entre ellos.
first_5_rows_base <- df[1:5, ]
dplyr
Puedes usar la función slice() y pasarle el rango de filas que deseas tomar.
first_5_rows_dplyr <- df %>%
slice(1:5)
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla