Selección de Datos - Técnicas Avanzadas
Ya sabes cómo seleccionar filas y columnas individuales utilizando indexación básica. Ahora, es momento de ir un paso más allá y explorar cómo seleccionar múltiples filas y columnas utilizando tanto R base como el paquete dplyr
. Estas técnicas son esenciales cuando se desea enfocar en partes específicas de un conjunto de datos o preparar los datos para un análisis posterior.
Selección de múltiples columnas
R base
Puedes seleccionar múltiples columnas combinando sus posiciones o nombres con la función c()
. El resultado es un data frame más pequeño que contiene solo las columnas especificadas.
Usando posiciones de columnas:
selected_data_base <- df[, c(1, 2, 3)]
Usando nombres de columnas:
selected_data_base <- df[, c("name", "selling_price", "transmission")]
dplyr
Puede utilizar la función select()
y pasar directamente los nombres de las columnas.
selected_data_dplyr <- df %>%
select(km_driven, fuel, transmission)
Indexación de valores individuales
Para acceder a un valor específico, proporcione tanto el número de fila como el de columna. Esto es útil al verificar o depurar puntos de datos individuales.
df[1, 2] # accesses the value in row 1, column 2
Segmentación de filas
En ocasiones, solo se requiere trabajar con las primeras filas o con filas específicas según su posición.
Base R
Puede seleccionar varias filas especificando el primer y el último índice y escribiendo un :
entre ellos.
first_5_rows_base <- df[1:5, ]
dplyr
Puede utilizar la función slice()
y pasarle el rango de filas que desea tomar.
first_5_rows_dplyr <- df %>%
slice(1:5)
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 4
Selección de Datos - Técnicas Avanzadas
Desliza para mostrar el menú
Ya sabes cómo seleccionar filas y columnas individuales utilizando indexación básica. Ahora, es momento de ir un paso más allá y explorar cómo seleccionar múltiples filas y columnas utilizando tanto R base como el paquete dplyr
. Estas técnicas son esenciales cuando se desea enfocar en partes específicas de un conjunto de datos o preparar los datos para un análisis posterior.
Selección de múltiples columnas
R base
Puedes seleccionar múltiples columnas combinando sus posiciones o nombres con la función c()
. El resultado es un data frame más pequeño que contiene solo las columnas especificadas.
Usando posiciones de columnas:
selected_data_base <- df[, c(1, 2, 3)]
Usando nombres de columnas:
selected_data_base <- df[, c("name", "selling_price", "transmission")]
dplyr
Puede utilizar la función select()
y pasar directamente los nombres de las columnas.
selected_data_dplyr <- df %>%
select(km_driven, fuel, transmission)
Indexación de valores individuales
Para acceder a un valor específico, proporcione tanto el número de fila como el de columna. Esto es útil al verificar o depurar puntos de datos individuales.
df[1, 2] # accesses the value in row 1, column 2
Segmentación de filas
En ocasiones, solo se requiere trabajar con las primeras filas o con filas específicas según su posición.
Base R
Puede seleccionar varias filas especificando el primer y el último índice y escribiendo un :
entre ellos.
first_5_rows_base <- df[1:5, ]
dplyr
Puede utilizar la función slice()
y pasarle el rango de filas que desea tomar.
first_5_rows_dplyr <- df %>%
slice(1:5)
¡Gracias por tus comentarios!