Hitta och ta bort dubbletter
Svep för att visa menyn
När du arbetar med datamängder är ett av de vanligaste strukturella problemen dubblettrader. Det är poster som förekommer mer än en gång och vanligtvis representerar samma data.
Dubbletter uppstår ofta när data slås samman från flera källor, importeras flera gånger eller matas in manuellt. Vid första anblicken kan allt se korrekt ut, men dubbletter kan allvarligt snedvrida din analys. Till exempel kan summor bli för höga och rapporter kan visa felaktiga resultat.
Hitta dubbletter
Innan du tar bort något är det viktigt att först identifiera dubbletter.
Ett sätt att göra detta är att använda funktionen COUNTIF:
=COUNTIF(A:A, A2)
Denna formel räknar hur många gånger ett värde förekommer i en kolumn. Om resultatet är större än 1 betyder det att värdet är en dubblett.
Ta bort dubbletter
När dubbletter har identifierats erbjuder Excel ett inbyggt verktyg för att ta bort dem.
Du kan markera tabellen, gå till fliken Data och använda Ta bort dubbletter. Excel skannar de valda kolumnerna och tar automatiskt bort upprepade rader.
Excel jämför valda kolumner rad för rad. Om den hittar identiska värden behålls ett exemplar och resten tas bort. Detta säkerställer att varje post endast förekommer en gång.
Uppgift
-
Hitta dubblettposter i datamängden.
-
Du kan märka att kolumnen
Order IDinnehåller dubbletter. Identifiera dessa dubblettposter först och ta sedan bort de duplicerade raderna helt med verktyget Ta bort dubbletter.
Använd =COUNTIF(A:A, A2) på kolumnen Order ID för att räkna hur många gånger varje ID förekommer. Om resultatet är större än 1 betyder det att värdet är en dubblett.
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal