Duplicaten Vinden en Verwijderen
Veeg om het menu te tonen
Bij het werken met datasets is een van de meest voorkomende structurele problemen dubbele rijen. Dit zijn records die meer dan eens voorkomen en meestal dezelfde gegevens vertegenwoordigen.
Duplicaten ontstaan vaak wanneer gegevens uit meerdere bronnen worden samengevoegd, meerdere keren worden geïmporteerd of handmatig worden ingevoerd. Op het eerste gezicht lijkt alles in orde, maar duplicaten kunnen je analyse ernstig verstoren. Zo kunnen totalen opgeblazen raken en rapporten onjuiste resultaten tonen.
Duplicaten vinden
Voordat je iets verwijdert, is het belangrijk om eerst duplicaten te identificeren.
Een manier om dit te doen is met de functie COUNTIF:
=COUNTIF(A:A, A2)
Deze formule telt hoe vaak een waarde in een kolom voorkomt. Als het resultaat groter is dan 1, betekent dit dat de waarde dubbel voorkomt.
Duplicaten verwijderen
Zodra duplicaten zijn geïdentificeerd, biedt Excel een ingebouwde tool om ze te verwijderen.
Selecteer de tabel, ga naar het tabblad Gegevens en gebruik Duplicaten verwijderen. Excel scant de geselecteerde kolommen en verwijdert automatisch herhaalde rijen.
Excel vergelijkt de geselecteerde kolommen rij voor rij. Als identieke waarden worden gevonden, blijft één exemplaar behouden en worden de overige verwijderd. Dit zorgt ervoor dat elk record slechts één keer voorkomt.
Dubbele records in de dataset vinden.
Het kan opvallen dat de kolom Order ID duplicaten bevat. Identificeer eerst deze dubbele records en verwijder vervolgens de volledige gedupliceerde rijen met behulp van de tool Duplicaten verwijderen.
Gebruik =COUNTIF(A:A, A2) op de kolom Order ID om te tellen hoe vaak elk ID voorkomt. Als het resultaat groter is dan 1, betekent dit dat de waarde een duplicaat is.
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.