Finding and Removing Duplicates
Svep för att visa menyn
När du arbetar med datamängder är ett av de vanligaste strukturella problemen dubblettrader. Det är poster som förekommer mer än en gång och vanligtvis representerar samma data.
Dubbletter uppstår ofta när data slås samman från flera källor, importeras flera gånger eller matas in manuellt. Vid första anblicken kan allt se korrekt ut, men dubbletter kan allvarligt snedvrida din analys. Till exempel kan summor bli för höga och rapporter kan visa felaktiga resultat.
Hitta dubbletter
Innan du tar bort något är det viktigt att först identifiera dubbletter.
Ett sätt att göra detta är att använda funktionen COUNTIF:
=COUNTIF(A:A, A2)
Den här formeln räknar hur många gånger ett värde förekommer i en kolumn. Om resultatet är större än 1 betyder det att värdet är en dubblett.
Ta bort dubbletter
När dubbletter har identifierats erbjuder Excel ett inbyggt verktyg för att ta bort dem.
Du kan markera tabellen, gå till fliken Data och använda Ta bort dubbletter. Excel skannar de valda kolumnerna och tar automatiskt bort upprepade rader.
Excel jämför de valda kolumnerna rad för rad. Om den hittar identiska värden behåller den ett exemplar och tar bort resten. Detta hjälper till att säkerställa att varje post endast förekommer en gång.
Hitta dubblettposter i datamängden.
Du kan märka att kolumnen Order ID innehåller dubbletter. Identifiera dessa dubblettposter först och ta sedan bort de duplicerade raderna helt med verktyget Ta bort dubbletter.
Använd =COUNTIF(A:A, A2) på kolumnen Order ID för att räkna hur många gånger varje ID förekommer. Om resultatet är större än 1 betyder det att värdet är en dubblett.
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal