Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Selección de Datos - Técnicas Avanzadas | Manipulación y Limpieza de Datos
Análisis de Datos con R

bookSelección de Datos - Técnicas Avanzadas

Ya sabes cómo seleccionar filas y columnas individuales utilizando indexación básica. Ahora, es momento de ir un paso más allá y explorar cómo seleccionar múltiples filas y columnas utilizando tanto R base como el paquete dplyr. Estas técnicas son esenciales cuando se desea enfocar en partes específicas de un conjunto de datos o preparar los datos para un análisis posterior.

Selección de múltiples columnas

R base

Puedes seleccionar múltiples columnas combinando sus posiciones o nombres con la función c(). El resultado es un data frame más pequeño que contiene solo las columnas especificadas.

Usando posiciones de columnas:

selected_data_base <- df[, c(1, 2, 3)]

Usando nombres de columnas:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Puede utilizar la función select() y pasar directamente los nombres de las columnas.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indexación de valores individuales

Para acceder a un valor específico, proporcione tanto el número de fila como el de columna. Esto es útil al verificar o depurar puntos de datos individuales.

df[1, 2]  # accesses the value in row 1, column 2

Segmentación de filas

En ocasiones, solo se requiere trabajar con las primeras filas o con filas específicas según su posición.

Base R

Puede seleccionar varias filas especificando el primer y el último índice y escribiendo un : entre ellos.

first_5_rows_base <- df[1:5, ]

dplyr

Puede utilizar la función slice() y pasarle el rango de filas que desea tomar.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

¿Qué hace df[1:5, ]?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 5

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Awesome!

Completion rate improved to 4

bookSelección de Datos - Técnicas Avanzadas

Desliza para mostrar el menú

Ya sabes cómo seleccionar filas y columnas individuales utilizando indexación básica. Ahora, es momento de ir un paso más allá y explorar cómo seleccionar múltiples filas y columnas utilizando tanto R base como el paquete dplyr. Estas técnicas son esenciales cuando se desea enfocar en partes específicas de un conjunto de datos o preparar los datos para un análisis posterior.

Selección de múltiples columnas

R base

Puedes seleccionar múltiples columnas combinando sus posiciones o nombres con la función c(). El resultado es un data frame más pequeño que contiene solo las columnas especificadas.

Usando posiciones de columnas:

selected_data_base <- df[, c(1, 2, 3)]

Usando nombres de columnas:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Puede utilizar la función select() y pasar directamente los nombres de las columnas.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indexación de valores individuales

Para acceder a un valor específico, proporcione tanto el número de fila como el de columna. Esto es útil al verificar o depurar puntos de datos individuales.

df[1, 2]  # accesses the value in row 1, column 2

Segmentación de filas

En ocasiones, solo se requiere trabajar con las primeras filas o con filas específicas según su posición.

Base R

Puede seleccionar varias filas especificando el primer y el último índice y escribiendo un : entre ellos.

first_5_rows_base <- df[1:5, ]

dplyr

Puede utilizar la función slice() y pasarle el rango de filas que desea tomar.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

¿Qué hace df[1:5, ]?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 5
some-alt