Selección de Datos - Técnicas Avanzadas
Ya sabes cómo seleccionar filas y columnas individuales utilizando la indexación básica. Ahora, es momento de ir un paso más allá y explorar cómo seleccionar múltiples filas y columnas utilizando tanto R base como el paquete dplyr
. Estas técnicas son esenciales cuando se desea enfocar en partes específicas de un conjunto de datos o preparar los datos para un análisis posterior.
Selección de múltiples columnas
R base
Puedes seleccionar múltiples columnas combinando sus posiciones o nombres con la función c()
. El resultado es un data frame más pequeño que contiene solo las columnas especificadas.
Usando posiciones de columnas:
selected_data_base <- df[, c(1, 2, 3)]
Usando nombres de columnas:
selected_data_base <- df[, c("name", "selling_price", "transmission")]
dplyr
Se puede utilizar la función select()
y pasar directamente los nombres de las columnas.
selected_data_dplyr <- df %>%
select(km_driven, fuel, transmission)
Indexación de valores individuales
Para acceder a un valor específico, proporcione tanto el número de fila como el de columna. Esto resulta útil al verificar o depurar puntos de datos individuales.
df[1, 2] # accesses the value in row 1, column 2
Segmentación de filas
En ocasiones, solo se requiere trabajar con las primeras filas o con filas específicas según su posición.
Base R
Puede seleccionar varias filas especificando el primer y el último índice y escribiendo un :
entre ellos.
first_5_rows_base <- df[1:5, ]
dplyr
Puede utilizar la función slice()
y pasarle el rango de filas que desea tomar.
first_5_rows_dplyr <- df %>%
slice(1:5)
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Can you explain the difference between selecting columns by position and by name in R?
How does the pipe operator improve code readability in dplyr?
Can you show how to select non-consecutive rows or columns using dplyr?
Awesome!
Completion rate improved to 4
Selección de Datos - Técnicas Avanzadas
Desliza para mostrar el menú
Ya sabes cómo seleccionar filas y columnas individuales utilizando la indexación básica. Ahora, es momento de ir un paso más allá y explorar cómo seleccionar múltiples filas y columnas utilizando tanto R base como el paquete dplyr
. Estas técnicas son esenciales cuando se desea enfocar en partes específicas de un conjunto de datos o preparar los datos para un análisis posterior.
Selección de múltiples columnas
R base
Puedes seleccionar múltiples columnas combinando sus posiciones o nombres con la función c()
. El resultado es un data frame más pequeño que contiene solo las columnas especificadas.
Usando posiciones de columnas:
selected_data_base <- df[, c(1, 2, 3)]
Usando nombres de columnas:
selected_data_base <- df[, c("name", "selling_price", "transmission")]
dplyr
Se puede utilizar la función select()
y pasar directamente los nombres de las columnas.
selected_data_dplyr <- df %>%
select(km_driven, fuel, transmission)
Indexación de valores individuales
Para acceder a un valor específico, proporcione tanto el número de fila como el de columna. Esto resulta útil al verificar o depurar puntos de datos individuales.
df[1, 2] # accesses the value in row 1, column 2
Segmentación de filas
En ocasiones, solo se requiere trabajar con las primeras filas o con filas específicas según su posición.
Base R
Puede seleccionar varias filas especificando el primer y el último índice y escribiendo un :
entre ellos.
first_5_rows_base <- df[1:5, ]
dplyr
Puede utilizar la función slice()
y pasarle el rango de filas que desea tomar.
first_5_rows_dplyr <- df %>%
slice(1:5)
¡Gracias por tus comentarios!