Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Seleção de Dados - Técnicas Avançadas | Manipulação e Limpeza de Dados
Análise de Dados com R

bookSeleção de Dados - Técnicas Avançadas

Você já sabe como selecionar linhas e colunas individuais usando indexação básica. Agora, é hora de avançar e explorar como selecionar múltiplas linhas e colunas utilizando tanto o R base quanto o pacote dplyr. Essas técnicas são essenciais quando se deseja focar em partes específicas de um conjunto de dados ou preparar os dados para análises posteriores.

Seleção de Múltiplas Colunas

R Base

É possível selecionar múltiplas colunas combinando suas posições ou nomes com a função c(). O resultado é um data frame menor contendo apenas as colunas especificadas.

Utilizando posições das colunas:

selected_data_base <- df[, c(1, 2, 3)]

Utilizando nomes das colunas:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

É possível utilizar a função select() e passar diretamente os nomes das colunas.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indexação de Valores Individuais

Para acessar um valor específico, forneça tanto o número da linha quanto o da coluna. Este método é útil para verificar ou depurar pontos de dados individuais.

df[1, 2]  # accesses the value in row 1, column 2

Fatiamento de Linhas

Em algumas situações, é necessário trabalhar apenas com as primeiras linhas ou com linhas específicas por posição.

Base R

É possível selecionar várias linhas especificando o primeiro e o último índice e escrevendo um : entre eles.

first_5_rows_base <- df[1:5, ]

dplyr

É possível utilizar a função slice() e passar o intervalo de linhas desejado.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

O que faz df[1:5, ]?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 5

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Suggested prompts:

Can you explain the difference between selecting columns by position and by name in R?

How does the pipe operator improve code readability in dplyr?

Can you show how to select non-consecutive rows or columns using dplyr?

Awesome!

Completion rate improved to 4

bookSeleção de Dados - Técnicas Avançadas

Deslize para mostrar o menu

Você já sabe como selecionar linhas e colunas individuais usando indexação básica. Agora, é hora de avançar e explorar como selecionar múltiplas linhas e colunas utilizando tanto o R base quanto o pacote dplyr. Essas técnicas são essenciais quando se deseja focar em partes específicas de um conjunto de dados ou preparar os dados para análises posteriores.

Seleção de Múltiplas Colunas

R Base

É possível selecionar múltiplas colunas combinando suas posições ou nomes com a função c(). O resultado é um data frame menor contendo apenas as colunas especificadas.

Utilizando posições das colunas:

selected_data_base <- df[, c(1, 2, 3)]

Utilizando nomes das colunas:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

É possível utilizar a função select() e passar diretamente os nomes das colunas.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indexação de Valores Individuais

Para acessar um valor específico, forneça tanto o número da linha quanto o da coluna. Este método é útil para verificar ou depurar pontos de dados individuais.

df[1, 2]  # accesses the value in row 1, column 2

Fatiamento de Linhas

Em algumas situações, é necessário trabalhar apenas com as primeiras linhas ou com linhas específicas por posição.

Base R

É possível selecionar várias linhas especificando o primeiro e o último índice e escrevendo um : entre eles.

first_5_rows_base <- df[1:5, ]

dplyr

É possível utilizar a função slice() e passar o intervalo de linhas desejado.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

O que faz df[1:5, ]?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 5
some-alt