Using Copilot to Remove Duplicates
Stryg for at vise menuen
Efter at have ryddet op i datasættet, er det sidste trin at fjerne dubletter.
I mange tilfælde er dublerede rækker ikke identiske. Den samme person kan optræde flere gange med forskellige værdier, så du skal definere, hvad der tæller som en dublet.
I stedet for at sammenligne hele rækker, fokuser på en nøglekolonne. I dette tilfælde bruges e-mailadressen til at identificere dubletter.
Dette sikrer, at hver person kun optræder én gang i dit datasæt.
Slet ikke dubletter med det samme. Disse rækker kan indeholde nyttige oplysninger.
Kopier først alle dublerede poster til et separat regneark. Fjern dem derefter fra hovedtabellen.
Dette beskytter dine data og giver dig mulighed for at gennemgå de fjernede poster senere.
Når du arbejder med opgaver i flere trin, skal du skrive prompts i en klar rækkefølge.
Opret et nyt regneark, identificér dubletter baseret på e-mail, kopier dem til det nye ark, og fjern dem derefter fra den oprindelige tabel.
Klar instruktion mindsker fejl og gør Copilots adfærd mere forudsigelig.
Efter at have kørt opgaven, skal du kontrollere begge ark.
Sørg for, at hovedtabellen kun indeholder unikke poster, og at alle fjernede rækker er gemt i det nye regneark.
Du har ryddet op og struktureret rodet data ved hjælp af Copilot. Dit datasæt er nu konsistent, komplet og klar til analyse i næste afsnit.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat