Preparación de datos limpios
Desliza para mostrar el menú
Los conjuntos de datos del mundo real suelen contener formatos inconsistentes, espacios adicionales y valores de texto desordenados. En este capítulo, limpieza y estandarización de los datos de clientes antes de utilizarlos en búsquedas y reportes.
Descarga el conjunto de datos de clientes e impórtalo en Excel antes de comenzar los ejercicios.
TRIM y PROPER
=PROPER(TRIM(Customers!B2))
TRIM(): elimina espacios adicionales;PROPER(): corrige la capitalización.
Funciones de mayúsculas y minúsculas
=UPPER(TRIM(Customers!B2))
=LOWER(TRIM(Customers!B2))
UPPER(): convierte el texto a mayúsculas;LOWER(): convierte el texto a minúsculas.
Función SUBSTITUTE
=SUBSTITUTE(Customers!C2, " ", "")
" ": carácter que se reemplaza;"": valor de reemplazo;- Elimina todos los espacios del valor del correo electrónico.
Funciones de extracción de texto
=RIGHT(A2, 3)
=LEFT(A2, 2)
=MID(A2, 2, 3)
RIGHT(): extrae texto desde el final;LEFT(): extrae texto desde el inicio;MID(): extrae texto desde el medio.
Función TEXT
=TEXT(Customers!D2, "MMM YYYY")
Convierte:
15/03/2023 → Mar 2023
Ir a:
Data → Get Data → From Text/CSV
Previsualizar el conjunto de datos antes de cargarlo en Excel.
Usar:
Use First Row as Headers
Cargar el conjunto de datos en una nueva hoja de cálculo.
Crear una nueva hoja de cálculo llamada:
Customers_Clean
Agregar las siguientes columnas:
Customer_ID
Full_Name_Clean
Dentro de la primera celda de Customer_ID, escribir:
=Customers!A2
Rellenar la fórmula hacia abajo en la columna.
Dentro de la primera celda de Full_Name_Clean, escribir:
=PROPER(TRIM(Customers!B2))
Rellenar la fórmula hacia abajo en la columna.
En una nueva columna, escribir:
=SUBSTITUTE(Customers!C2, " ", "")
Esto elimina los espacios no válidos de las direcciones de correo electrónico.
Extracción por la derecha:
=RIGHT(A2, 3)
Extracción intermedia:
=MID(A2, 2, 3)
Escribir:
=TEXT(Customers!D2, "MMM YYYY")
Esto estandariza el formato de fechas para los informes.
1. ¿Por qué TRIM por sí solo no es suficiente para limpiar direcciones de correo electrónico?
2. ¿Qué hace esta fórmula?
3. ¿Cuál es el propósito de la función TEXT en esta lección?
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla