Forberedelse af Rene Data
Stryg for at vise menuen
Virkelige datasæt indeholder ofte inkonsekvent formatering, ekstra mellemrum og rodet tekst. I dette kapitel renses og standardiseres kundedata, før de bruges i opslag og rapportering.
Download kundedatasættet og importer det til Excel, før du starter øvelserne.
TRIM og PROPER
=PROPER(TRIM(Customers!B2))
TRIM(): fjerner ekstra mellemrum;PROPER(): retter store og små bogstaver.
Funktioner til store og små bogstaver
=UPPER(TRIM(Customers!B2))
=LOWER(TRIM(Customers!B2))
UPPER(): konverterer tekst til store bogstaver;LOWER(): konverterer tekst til små bogstaver.
SUBSTITUTE-funktion
=SUBSTITUTE(Customers!C2, " ", "")
" ": tegn der erstattes;"": erstatningsværdi;- Fjerner alle mellemrum fra e-mail-værdien.
Tekstekstraktionsfunktioner
=RIGHT(A2, 3)
=LEFT(A2, 2)
=MID(A2, 2, 3)
RIGHT(): udtrækker tekst fra slutningen;LEFT(): udtrækker tekst fra begyndelsen;MID(): udtrækker tekst fra midten.
TEKST-funktion
=TEXT(Customers!D2, "MMM YYYY")
Konverterer:
15/03/2023 → Mar 2023
Gå til:
Data → Get Data → From Text/CSV
Forhåndsvis datasættet før det indlæses i Excel.
Brug:
Use First Row as Headers
Indlæs datasættet i et nyt regneark.
Opret et nyt regneark med navnet:
Customers_Clean
Tilføj følgende kolonner:
Customer_ID
Full_Name_Clean
I den første Customer_ID-celle, skriv:
=Customers!A2
Udfyld formlen nedad i kolonnen.
I den første Full_Name_Clean-celle, skriv:
=PROPER(TRIM(Customers!B2))
Udfyld formlen nedad i kolonnen.
I en ny kolonne, skriv:
=SUBSTITUTE(Customers!C2, " ", "")
Dette fjerner ugyldige mellemrum fra e-mailadresser.
Udtræk til højre:
=RIGHT(A2, 3)
Udtræk i midten:
=MID(A2, 2, 3)
Skriv:
=TEXT(Customers!D2, "MMM YYYY")
Dette standardiserer rapporteringsformatet for datoer.
1. Hvorfor er TRIM alene ikke nok til at rense e-mailadresser?
2. Hvad gør denne formel?
3. Hvad er formålet med TEXT-funktionen i denne lektion?
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat