Vad är smutsig data?
Svep för att visa menyn
Innan du kan rengöra data i Excel behöver du tydligt förstå vad "smutsig data" är och varför det orsakar problem.
Smutsig data i Excel är data som innehåller fel, inkonsekvenser eller felaktig formatering, vilket gör den opålitlig för analys, beräkningar eller rapportering.
Det största problemet är att Excel behandlar värden baserat på deras interna format, inte bara hur de ser ut. På grund av detta kan även små inkonsekvenser helt förstöra formler, sortering eller filtrering.
Detta händer oftast när data kommer från externa källor. Till exempel, när du kopierar data från en webbplats eller importerar en CSV-fil, kanske Excel inte korrekt känner igen siffror, datum eller text. Som ett resultat får du en blandning av format i en och samma kolumn, även om allt ser likadant ut visuellt.
Låt oss titta på ett mycket enkelt exempel:
Name | Salary |
|---|---|
John | 1000 |
Anna | 2000 |
Mike | "3000" |
Vid första anblicken ser allt korrekt ut. Alla löner verkar vara siffror. Men det finns ett dolt problem: "3000" är lagrat som text, inte som ett tal.
Detta leder till oväntat beteende vid addition, subtraktion och liknande operationer.
Viktig insikt
Smutsig data är farlig inte för att den ser fel ut, utan för att den ser korrekt ut men beter sig felaktigt.
Därför är det första steget när du arbetar med Excel-data alltid: inspektera noggrant vilken typ av data du faktiskt har, inte bara hur den ser ut.
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal