Localização e Remoção de Duplicatas
Deslize para mostrar o menu
Ao trabalhar com conjuntos de dados, um dos problemas estruturais mais comuns são as linhas duplicadas. Esses são registros que aparecem mais de uma vez e geralmente representam os mesmos dados.
Os duplicados costumam ocorrer quando dados são mesclados de várias fontes, importados diversas vezes ou inseridos manualmente. À primeira vista, tudo pode parecer correto, mas os duplicados podem distorcer seriamente sua análise. Por exemplo, totais podem ser inflados e relatórios podem apresentar resultados incorretos.
Encontrando Duplicatas
Antes de excluir qualquer coisa, é importante primeiro identificar as duplicatas.
Uma maneira de fazer isso é usando a função COUNTIF:
=COUNTIF(A:A, A2)
Essa fórmula conta quantas vezes um valor aparece em uma coluna. Se o resultado for maior que 1, significa que o valor está duplicado.
Removendo Duplicatas
Depois de identificar as duplicatas, o Excel oferece uma ferramenta integrada para removê-las.
Você pode selecionar a tabela, ir até a guia Dados e usar Remover Duplicatas. O Excel irá analisar as colunas selecionadas e remover automaticamente as linhas repetidas.
O Excel compara as colunas selecionadas linha por linha. Se encontrar valores idênticos, mantém uma instância e remove as demais. Isso ajuda a garantir que cada registro apareça apenas uma vez.
Tarefa
-
Localizar registros duplicados no conjunto de dados.
-
É possível notar que a coluna
Order IDcontém duplicatas. Identificar esses registros duplicados primeiro e, em seguida, remover completamente as linhas duplicadas utilizando a ferramenta Remover Duplicatas.
Use =COUNTIF(A:A, A2) na coluna Order ID para contar quantas vezes cada ID aparece. Se o resultado for maior que 1, significa que o valor é um duplicado.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo