Finne og fjerne duplikater
Sveip for å vise menyen
Når du arbeider med datasett, er en av de vanligste strukturelle problemene du kan møte, dupliserte rader. Dette er poster som vises mer enn én gang og vanligvis representerer de samme dataene.
Duplikater oppstår ofte når data flettes fra flere kilder, importeres flere ganger eller legges inn manuelt. Ved første øyekast kan alt se riktig ut, men duplikater kan i stor grad forvrenge analysen din. For eksempel kan summer bli oppblåste, og rapporter kan vise feil resultater.
Finne duplikater
Før du sletter noe, er det viktig å først identifisere duplikater.
En måte å gjøre dette på er å bruke funksjonen COUNTIF:
=COUNTIF(A:A, A2)
Denne formelen teller hvor mange ganger en verdi forekommer i en kolonne. Hvis resultatet er større enn 1, betyr det at verdien er duplisert.
Fjerne duplikater
Når duplikater er identifisert, tilbyr Excel et innebygd verktøy for å fjerne dem.
Du kan velge tabellen, gå til Data-fanen og bruke Fjern duplikater. Excel vil skanne de valgte kolonnene og automatisk fjerne gjentatte rader.
Excel sammenligner de valgte kolonnene rad for rad. Hvis den finner identiske verdier, beholder den én forekomst og fjerner resten. Dette bidrar til at hver post kun vises én gang.
Finn dupliserte poster i datasettet.
Du kan legge merke til at kolonnen Order ID inneholder duplikater. Identifiser disse dupliserte postene først, og fjern deretter de dupliserte radene fullstendig ved å bruke verktøyet Fjern duplikater.
Bruk =COUNTIF(A:A, A2) på kolonnen Order ID for å telle hvor mange ganger hver ID forekommer. Hvis resultatet er større enn 1, betyr det at verdien er en duplikat.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår