Mikä on likainen data?
Pyyhkäise näyttääksesi valikon
Ennen kuin voit puhdistaa dataa Excelissä, sinun täytyy ymmärtää selkeästi, mitä "likainen data" tarkoittaa ja miksi se aiheuttaa ongelmia.
Likainen data Excelissä tarkoittaa dataa, jossa on virheitä, epäjohdonmukaisuuksia tai väärää muotoilua, mikä tekee siitä epäluotettavaa analysointiin, laskentaan tai raportointiin.
Suurin ongelma on, että Excel käsittelee arvoja niiden sisäisen muodon perusteella, ei pelkästään ulkoasun mukaan. Tämän vuoksi jopa pienet epäjohdonmukaisuudet voivat täysin rikkoa kaavat, lajittelun tai suodatuksen.
Tämä tapahtuu yleensä, kun data tulee ulkoisista lähteistä. Esimerkiksi, kun kopioit dataa verkkosivulta tai tuot CSV-tiedoston, Excel ei välttämättä tunnista oikein numeroita, päivämääriä tai tekstiä. Tämän seurauksena saat sekaisin eri muotoja yhteen sarakkeeseen, vaikka kaikki näyttäisivätkin samanlaisilta.
Tarkastellaan hyvin yksinkertaista esimerkkiä:
Name | Salary |
|---|---|
John | 1000 |
Anna | 2000 |
Mike | "3000" |
Päällisin puolin kaikki näyttää oikealta. Kaikki palkat vaikuttavat olevan numeroita. Mutta piilevä ongelma on: "3000" on tallennettu tekstinä, ei numerona.
Tämä aiheuttaa odottamatonta käyttäytymistä laskettaessa yhteen, vähennettäessä ja muissa toiminnoissa.
Keskeinen oivallus
Likainen data on vaarallista ei siksi, että se näyttäisi väärältä, vaan koska se näyttää oikealta mutta käyttäytyy väärin.
Siksi ensimmäinen askel Excel-datan kanssa on aina: tarkista huolellisesti, minkä tyyppistä dataa sinulla todella on, ei vain miltä se näyttää.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme