Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Seleção de Dados - Técnicas Avançadas | Manipulação e Limpeza de Dados
Análise de Dados com R

bookSeleção de Dados - Técnicas Avançadas

Você já sabe como selecionar linhas e colunas individuais utilizando indexação básica. Agora, é hora de avançar e explorar como selecionar múltiplas linhas e colunas utilizando tanto o R base quanto o pacote dplyr. Essas técnicas são essenciais quando se deseja focar em partes específicas de um conjunto de dados ou preparar os dados para análises posteriores.

Seleção de Múltiplas Colunas

R Base

É possível selecionar múltiplas colunas combinando suas posições ou nomes com a função c(). O resultado é um data frame reduzido contendo apenas as colunas especificadas.

Utilizando posições das colunas:

selected_data_base <- df[, c(1, 2, 3)]

Utilizando nomes das colunas:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

É possível utilizar a função select() e passar diretamente os nomes das colunas.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indexação de Valores Individuais

Para acessar um valor específico, forneça tanto o número da linha quanto o da coluna. Esta abordagem é útil para verificar ou depurar pontos de dados individuais.

df[1, 2]  # accesses the value in row 1, column 2

Fatiamento de Linhas

Em algumas situações, é necessário trabalhar apenas com as primeiras linhas ou com linhas específicas por posição.

Base R

É possível selecionar várias linhas especificando o primeiro e o último índice, utilizando : entre eles.

first_5_rows_base <- df[1:5, ]

dplyr

É possível utilizar a função slice() e passar o intervalo de linhas desejado.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

O que faz df[1:5, ]?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 5

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Awesome!

Completion rate improved to 4

bookSeleção de Dados - Técnicas Avançadas

Deslize para mostrar o menu

Você já sabe como selecionar linhas e colunas individuais utilizando indexação básica. Agora, é hora de avançar e explorar como selecionar múltiplas linhas e colunas utilizando tanto o R base quanto o pacote dplyr. Essas técnicas são essenciais quando se deseja focar em partes específicas de um conjunto de dados ou preparar os dados para análises posteriores.

Seleção de Múltiplas Colunas

R Base

É possível selecionar múltiplas colunas combinando suas posições ou nomes com a função c(). O resultado é um data frame reduzido contendo apenas as colunas especificadas.

Utilizando posições das colunas:

selected_data_base <- df[, c(1, 2, 3)]

Utilizando nomes das colunas:

selected_data_base <- df[, c("name", "selling_price", "transmission")]

dplyr

É possível utilizar a função select() e passar diretamente os nomes das colunas.

selected_data_dplyr <- df %>%
  select(km_driven, fuel, transmission)

Indexação de Valores Individuais

Para acessar um valor específico, forneça tanto o número da linha quanto o da coluna. Esta abordagem é útil para verificar ou depurar pontos de dados individuais.

df[1, 2]  # accesses the value in row 1, column 2

Fatiamento de Linhas

Em algumas situações, é necessário trabalhar apenas com as primeiras linhas ou com linhas específicas por posição.

Base R

É possível selecionar várias linhas especificando o primeiro e o último índice, utilizando : entre eles.

first_5_rows_base <- df[1:5, ]

dplyr

É possível utilizar a função slice() e passar o intervalo de linhas desejado.

first_5_rows_dplyr <- df %>%
  slice(1:5)
question mark

O que faz df[1:5, ]?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 5
some-alt