Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Selección de Datos - Técnicas Avanzadas | Manipulación y Limpieza de Datos
Análisis de Datos con R

bookSelección de Datos - Técnicas Avanzadas

Ya sabes cómo seleccionar filas y columnas individuales utilizando la indexación básica. Ahora, es momento de ir un paso más allá y explorar cómo seleccionar múltiples filas y columnas utilizando tanto R base como el paquete dplyr. Estas técnicas son esenciales cuando se desea enfocar en partes específicas de un conjunto de datos o preparar los datos para un análisis posterior.

Selección de múltiples columnas

R base

Puedes seleccionar múltiples columnas combinando sus posiciones o nombres con la función c(). El resultado es un data frame más pequeño que contiene solo las columnas especificadas.

Usando posiciones de columnas:

selected_data_base <- df[, c(1, 2, 3)]

Usando nombres de columnas:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Se puede utilizar la función select() y pasar directamente los nombres de las columnas.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indexación de valores individuales

Para acceder a un valor específico, proporcione tanto el número de fila como el de columna. Esto resulta útil al verificar o depurar puntos de datos individuales.

df[1, 2]  # accesses the value in row 1, column 2

Segmentación de filas

En ocasiones, solo se requiere trabajar con las primeras filas o con filas específicas según su posición.

Base R

Puede seleccionar varias filas especificando el primer y el último índice y escribiendo un : entre ellos.

first_5_rows_base <- df[1:5, ]

dplyr

Puede utilizar la función slice() y pasarle el rango de filas que desea tomar.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

¿Qué hace df[1:5, ]?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 5

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Suggested prompts:

Can you explain the difference between selecting columns by position and by name in R?

How does the pipe operator improve code readability in dplyr?

Can you show how to select non-consecutive rows or columns using dplyr?

Awesome!

Completion rate improved to 4

bookSelección de Datos - Técnicas Avanzadas

Desliza para mostrar el menú

Ya sabes cómo seleccionar filas y columnas individuales utilizando la indexación básica. Ahora, es momento de ir un paso más allá y explorar cómo seleccionar múltiples filas y columnas utilizando tanto R base como el paquete dplyr. Estas técnicas son esenciales cuando se desea enfocar en partes específicas de un conjunto de datos o preparar los datos para un análisis posterior.

Selección de múltiples columnas

R base

Puedes seleccionar múltiples columnas combinando sus posiciones o nombres con la función c(). El resultado es un data frame más pequeño que contiene solo las columnas especificadas.

Usando posiciones de columnas:

selected_data_base <- df[, c(1, 2, 3)]

Usando nombres de columnas:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

Se puede utilizar la función select() y pasar directamente los nombres de las columnas.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indexación de valores individuales

Para acceder a un valor específico, proporcione tanto el número de fila como el de columna. Esto resulta útil al verificar o depurar puntos de datos individuales.

df[1, 2]  # accesses the value in row 1, column 2

Segmentación de filas

En ocasiones, solo se requiere trabajar con las primeras filas o con filas específicas según su posición.

Base R

Puede seleccionar varias filas especificando el primer y el último índice y escribiendo un : entre ellos.

first_5_rows_base <- df[1:5, ]

dplyr

Puede utilizar la función slice() y pasarle el rango de filas que desea tomar.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

¿Qué hace df[1:5, ]?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 5
some-alt