Desliza para mostrar el menú

Ya sabes cómo seleccionar filas y columnas individuales utilizando la indexación básica. Ahora es momento de ir un paso más allá y explorar cómo seleccionar múltiples filas y columnas utilizando tanto R base como el paquete dplyr. Estas técnicas son esenciales cuando se desea enfocar en partes específicas de un conjunto de datos o preparar los datos para un análisis posterior.

Selección de múltiples columnas

R base

Es posible seleccionar múltiples columnas combinando sus posiciones o nombres con la función c(). El resultado es un data frame más pequeño que contiene solo las columnas especificadas.

Usando posiciones de columnas:

selected_data_base <- df[, c(1, 2, 3)]

Usando nombres de columnas:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Puedes utilizar la función select() y pasar directamente los nombres de las columnas.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indexación de valores individuales

Para acceder a un valor específico, proporciona tanto el número de fila como el de columna. Esto es útil al revisar o depurar puntos de datos individuales.

df[1, 2]  # accesses the value in row 1, column 2

Segmentación de filas

A veces solo se desea trabajar con las primeras filas o con filas específicas por posición.

Base R

Puedes seleccionar varias filas especificando el primer y el último índice y escribiendo un : entre ellos.

first_5_rows_base <- df[1:5, ]

dplyr

Puedes usar la función slice() y pasarle el rango de filas que deseas tomar.

first_5_rows_dplyr <- df %>%
  slice(1:5)

¿Todo estuvo claro?

¡Gracias por tus comentarios!

Sección 1. Capítulo 5

Pregunte a AI

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Selección de Datos - Técnicas Avanzadas

Selección de múltiples columnas

R base

Es posible seleccionar múltiples columnas combinando sus posiciones o nombres con la función c(). El resultado es un data frame más pequeño que contiene solo las columnas especificadas.

Usando posiciones de columnas:

selected_data_base <- df[, c(1, 2, 3)]

Usando nombres de columnas:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Puedes utilizar la función select() y pasar directamente los nombres de las columnas.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indexación de valores individuales

Para acceder a un valor específico, proporciona tanto el número de fila como el de columna. Esto es útil al revisar o depurar puntos de datos individuales.

df[1, 2]  # accesses the value in row 1, column 2

Segmentación de filas

A veces solo se desea trabajar con las primeras filas o con filas específicas por posición.

Base R

Puedes seleccionar varias filas especificando el primer y el último índice y escribiendo un : entre ellos.

first_5_rows_base <- df[1:5, ]

dplyr

Puedes usar la función slice() y pasarle el rango de filas que deseas tomar.

first_5_rows_dplyr <- df %>%
  slice(1:5)

¿Todo estuvo claro?

¡Gracias por tus comentarios!

Sección 1. Capítulo 5