Duplikaattien Etsiminen ja Poistaminen
Pyyhkäise näyttääksesi valikon
Työskenneltäessä tietoaineistojen kanssa yksi yleisimmistä rakenteellisista ongelmista on päällekkäiset rivit. Nämä ovat tietueita, jotka esiintyvät useammin kuin kerran ja edustavat yleensä samaa dataa.
Päällekkäisyyksiä syntyy usein, kun tietoja yhdistetään useista lähteistä, tuodaan useaan kertaan tai syötetään manuaalisesti. Aluksi kaikki saattaa näyttää olevan kunnossa, mutta päällekkäisyydet voivat vakavasti vääristää analyysiäsi. Esimerkiksi summat voivat kasvaa liikaa ja raportit voivat näyttää virheellisiä tuloksia.
Päällekkäisyyksien etsiminen
Ennen kuin poistat mitään, on tärkeää ensin tunnistaa päällekkäisyydet.
Yksi tapa tehdä tämä on käyttää COUNTIF-funktiota:
=COUNTIF(A:A, A2)
Tämä kaava laskee, kuinka monta kertaa arvo esiintyy sarakkeessa. Jos tulos on suurempi kuin 1, arvo on päällekkäinen.
Päällekkäisyyksien poistaminen
Kun päällekkäisyydet on tunnistettu, Excel tarjoaa sisäänrakennetun työkalun niiden poistamiseen.
Voit valita taulukon, siirtyä Data-välilehdelle ja käyttää Remove Duplicates -toimintoa. Excel tarkistaa valitut sarakkeet ja poistaa automaattisesti toistuvat rivit.
Excel vertaa valittuja sarakkeita rivi riviltä. Jos se löytää identtisiä arvoja, se säilyttää yhden esiintymän ja poistaa loput. Tämä auttaa varmistamaan, että jokainen tietue esiintyy vain kerran.
Tehtävä
-
Etsi päällekkäiset tietueet aineistosta.
-
Saatat huomata, että
Order ID-sarake sisältää päällekkäisyyksiä. Tunnista nämä päällekkäiset tietueet ensin ja poista sitten kokonaiset päällekkäiset rivit käyttämällä Remove Duplicates -työkalua.
Käytä kaavaa =COUNTIF(A:A, A2) sarakkeessa Order ID laskeaksesi, kuinka monta kertaa kukin tunnus esiintyy. Jos tulos on suurempi kuin 1, arvo on kaksoiskappale.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme