Préparation de données propres
Glissez pour afficher le menu
Les ensembles de données réels contiennent souvent des formats incohérents, des espaces superflus et des valeurs textuelles désordonnées. Dans ce chapitre, nettoyage et standardisation des données clients avant leur utilisation dans les recherches et les rapports.
Télécharger le jeu de données clients et l'importer dans Excel avant de commencer les exercices.
TRIM et PROPER
=PROPER(TRIM(Customers!B2))
TRIM(): supprime les espaces superflus ;PROPER(): corrige la capitalisation.
Fonctions de casse
=UPPER(TRIM(Customers!B2))
=LOWER(TRIM(Customers!B2))
UPPER(): convertit le texte en majuscules ;LOWER(): convertit le texte en minuscules.
Fonction SUBSTITUTE
=SUBSTITUTE(Customers!C2, " ", "")
" ": caractère remplacé ;"": valeur de remplacement ;- Supprime tous les espaces de la valeur de l'adresse e-mail.
Fonctions d'extraction de texte
=RIGHT(A2, 3)
=LEFT(A2, 2)
=MID(A2, 2, 3)
RIGHT(): extrait le texte à partir de la fin ;LEFT(): extrait le texte à partir du début ;MID(): extrait le texte à partir du milieu.
Fonction TEXT
=TEXT(Customers!D2, "MMM YYYY")
Convertit :
15/03/2023 → Mar 2023
Aller à :
Data → Get Data → From Text/CSV
Prévisualiser l'ensemble de données avant de le charger dans Excel.
Utiliser :
Use First Row as Headers
Charger l'ensemble de données dans une nouvelle feuille de calcul.
Créer une nouvelle feuille de calcul nommée :
Customers_Clean
Ajouter les colonnes suivantes :
Customer_ID
Full_Name_Clean
Dans la première cellule Customer_ID, saisir :
=Customers!A2
Recopier la formule vers le bas de la colonne.
Dans la première cellule Full_Name_Clean, saisir :
=PROPER(TRIM(Customers!B2))
Recopier la formule vers le bas de la colonne.
Dans une nouvelle colonne, saisir :
=SUBSTITUTE(Customers!C2, " ", "")
Ceci supprime les espaces invalides dans les adresses e-mail.
Extraction à droite :
=RIGHT(A2, 3)
Extraction au milieu :
=MID(A2, 2, 3)
Saisir :
=TEXT(Customers!D2, "MMM YYYY")
Ceci standardise le format de rapport pour les dates.
1. Pourquoi la fonction TRIM seule n'est-elle pas suffisante pour nettoyer les adresses e-mail ?
2. Que fait cette formule ?
3. Quel est le but de la fonction TEXT dans cette leçon ?
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion