Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda O Que Faremos com os Valores NaN? | Pré-processamento de Dados
Técnicas Avançadas em Pandas

bookO Que Faremos com os Valores NaN?

No capítulo anterior, você obteve o seguinte resultado:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

O conjunto de dados possui 418 linhas. Observe a coluna Cabin, onde há 327 valores ausentes. Não faz sentido preenchê-los, pois temos informações mínimas aqui. Portanto, neste caso, a melhor solução é excluir a coluna que não é útil para nós. Um dos motivos é que poderíamos excluir apenas as linhas que contêm valores ausentes, mas não podemos remover 327 linhas de 418. Assim, vamos entender como fazer isso.

Para excluir uma coluna, deve-se aplicar o método .drop() ao conjunto de dados. A sintaxe é a seguinte:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Explicação:

  • .drop() - método que exclui colunas;
  • columns = 'column_name' ou columns = ['column_1', 'column_2'] - argumento da função, onde se especifica o nome ou os nomes das colunas que se deseja excluir;
  • inplace = True - argumento útil do pandas que permite salvar todas as alterações. Pode ser utilizado em outras funções também; veremos algumas delas mais adiante.
Tarefa

Swipe to start coding

Sua tarefa é excluir a coluna com o maior número de valores NaN. Siga o algoritmo:

  1. Exclua a coluna 'Cabin' utilizando o argumento inplace = True.
  2. Exiba 5 linhas aleatórias do conjunto de dados.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 5. Capítulo 3
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

close

Awesome!

Completion rate improved to 3.03

bookO Que Faremos com os Valores NaN?

Deslize para mostrar o menu

No capítulo anterior, você obteve o seguinte resultado:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

O conjunto de dados possui 418 linhas. Observe a coluna Cabin, onde há 327 valores ausentes. Não faz sentido preenchê-los, pois temos informações mínimas aqui. Portanto, neste caso, a melhor solução é excluir a coluna que não é útil para nós. Um dos motivos é que poderíamos excluir apenas as linhas que contêm valores ausentes, mas não podemos remover 327 linhas de 418. Assim, vamos entender como fazer isso.

Para excluir uma coluna, deve-se aplicar o método .drop() ao conjunto de dados. A sintaxe é a seguinte:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Explicação:

  • .drop() - método que exclui colunas;
  • columns = 'column_name' ou columns = ['column_1', 'column_2'] - argumento da função, onde se especifica o nome ou os nomes das colunas que se deseja excluir;
  • inplace = True - argumento útil do pandas que permite salvar todas as alterações. Pode ser utilizado em outras funções também; veremos algumas delas mais adiante.
Tarefa

Swipe to start coding

Sua tarefa é excluir a coluna com o maior número de valores NaN. Siga o algoritmo:

  1. Exclua a coluna 'Cabin' utilizando o argumento inplace = True.
  2. Exiba 5 linhas aleatórias do conjunto de dados.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 5. Capítulo 3
single

single

some-alt