Hvad er beskidte data?
Stryg for at vise menuen
Før du kan rense data i Excel, skal du have en klar forståelse af, hvad "beskidte data" er, og hvorfor de skaber problemer.
Beskidte data i Excel er data, der indeholder fejl, uoverensstemmelser eller forkert formatering, hvilket gør dem upålidelige til analyse, beregninger eller rapportering.
Det største problem er, at Excel behandler værdier ud fra deres interne format og ikke kun ud fra, hvordan de ser ud. Derfor kan selv små uoverensstemmelser fuldstændigt ødelægge formler, sortering eller filtrering.
Dette sker ofte, når data kommer fra eksterne kilder. For eksempel, når du kopierer data fra en hjemmeside eller importerer en CSV-fil, genkender Excel måske ikke tal, datoer eller tekst korrekt. Som resultat får du en blanding af formater i én kolonne, selvom alt visuelt ser ens ud.
Lad os se på et meget simpelt eksempel:
Name | Salary |
|---|---|
John | 1000 |
Anna | 2000 |
Mike | "3000" |
Ved første øjekast ser alt korrekt ud. Alle lønninger ser ud til at være tal. Men der er et skjult problem: "3000" er gemt som tekst, ikke som et tal.
Dette fører til uventet adfærd ved addition, subtraktion osv.
Vigtig indsigt
Snavset data er farligt, ikke fordi det ser forkert ud, men fordi det ser korrekt ud, mens det opfører sig forkert.
Derfor er det første skridt, når du arbejder med Excel-data, altid: undersøg nøje, hvilken type data du faktisk har, ikke kun hvordan det ser ud.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat