Como Excluir Apenas Valores NaN?
Você já aprendeu uma forma de lidar com valores NaN, mas vamos refletir sobre o que pode ser feito com os demais. Observe novamente a quantidade de valores ausentes em cada coluna:
No capítulo anterior, você obteve o seguinte resultado:
PassengerId | 0 |
Survived | 0 |
Pclass | 0 |
Name | 0 |
Sex | 0 |
Age | 86 |
SibSp | 0 |
Parch | 0 |
Ticket | 0 |
Fare | 1 |
Embarked | 0 |
A maneira mais simples é excluir todas as linhas que contêm valores ausentes. Por exemplo, 86
linhas com idades estão ausentes, assim como 1
linha na coluna 'Fare'
. Vamos analisar como podemos excluí-las. No pandas, é possível fazer isso utilizando um método simples, semelhante ao do capítulo anterior, chamado .dropna()
:
data.dropna(inplace=True)
Aqui, pode-se utilizar inplace=True
para salvar todas as alterações. Vamos detalhar a função. Se uma linha na coluna 'Age'
possuir um valor NaN, esse método irá excluir todos os valores da mesma linha. A linha inteira será removida caso pelo menos um valor esteja ausente.
Swipe to start coding
Sua tarefa aqui é remover todos os valores ausentes e verificar se tudo foi feito corretamente.
- Remova os valores
NaN
utilizando o argumentoinplace=True
. - Calcule o número de valores
NaN
.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
What are the potential drawbacks of deleting rows with missing values?
Can you explain how .dropna() works in more detail?
Are there alternative methods to handle missing values besides deleting rows?
Awesome!
Completion rate improved to 3.03
Como Excluir Apenas Valores NaN?
Deslize para mostrar o menu
Você já aprendeu uma forma de lidar com valores NaN, mas vamos refletir sobre o que pode ser feito com os demais. Observe novamente a quantidade de valores ausentes em cada coluna:
No capítulo anterior, você obteve o seguinte resultado:
PassengerId | 0 |
Survived | 0 |
Pclass | 0 |
Name | 0 |
Sex | 0 |
Age | 86 |
SibSp | 0 |
Parch | 0 |
Ticket | 0 |
Fare | 1 |
Embarked | 0 |
A maneira mais simples é excluir todas as linhas que contêm valores ausentes. Por exemplo, 86
linhas com idades estão ausentes, assim como 1
linha na coluna 'Fare'
. Vamos analisar como podemos excluí-las. No pandas, é possível fazer isso utilizando um método simples, semelhante ao do capítulo anterior, chamado .dropna()
:
data.dropna(inplace=True)
Aqui, pode-se utilizar inplace=True
para salvar todas as alterações. Vamos detalhar a função. Se uma linha na coluna 'Age'
possuir um valor NaN, esse método irá excluir todos os valores da mesma linha. A linha inteira será removida caso pelo menos um valor esteja ausente.
Swipe to start coding
Sua tarefa aqui é remover todos os valores ausentes e verificar se tudo foi feito corretamente.
- Remova os valores
NaN
utilizando o argumentoinplace=True
. - Calcule o número de valores
NaN
.
Solução
Obrigado pelo seu feedback!
single