Contenido del Curso
Procesamiento Previo de Datos
Procesamiento Previo de Datos
Cambio del Tipo de Datos
Ya sabe cómo cambiar el tipo de datos de cadena a número, por ejemplo. Pero echemos un vistazo más de cerca a esta pequeña pero importante tarea.
Empecemos por cambiar el tipo de datos de cadena a datetime
. La mayoría de las veces, lo necesitará para trabajar con series temporales. Puedes realizar esta operación utilizando el método .to_datetime()
:
Para convertir una cadena en un bool
- utilice el método .map()
en la columna cuyos valores desea cambiar:
Por ejemplo, si tiene una columna de precio que se parece a "$198,800" y quiere convertirla en un float
- debe crear funciones de transformación personalizadas:
import pandas as pd import re # Create simple dataset df = pd.DataFrame(data={'Price':['$4,122.94', '$1,002.3']}) # Create a custom function to transform data # x - value from column def price2int(x): return float(re.sub(r'[\$\,]', '', x)) # Use custom transformation on a column df['Price'] = df['Price'].apply(price2int)
Tarea
Lea el conjunto de datos sales_data_types.csv
y cambie el tipo de datos de la columna Active
de str
a bool
.
¡Gracias por tus comentarios!
Cambio del Tipo de Datos
Ya sabe cómo cambiar el tipo de datos de cadena a número, por ejemplo. Pero echemos un vistazo más de cerca a esta pequeña pero importante tarea.
Empecemos por cambiar el tipo de datos de cadena a datetime
. La mayoría de las veces, lo necesitará para trabajar con series temporales. Puedes realizar esta operación utilizando el método .to_datetime()
:
Para convertir una cadena en un bool
- utilice el método .map()
en la columna cuyos valores desea cambiar:
Por ejemplo, si tiene una columna de precio que se parece a "$198,800" y quiere convertirla en un float
- debe crear funciones de transformación personalizadas:
import pandas as pd import re # Create simple dataset df = pd.DataFrame(data={'Price':['$4,122.94', '$1,002.3']}) # Create a custom function to transform data # x - value from column def price2int(x): return float(re.sub(r'[\$\,]', '', x)) # Use custom transformation on a column df['Price'] = df['Price'].apply(price2int)
Tarea
Lea el conjunto de datos sales_data_types.csv
y cambie el tipo de datos de la columna Active
de str
a bool
.
¡Gracias por tus comentarios!
Cambio del Tipo de Datos
Ya sabe cómo cambiar el tipo de datos de cadena a número, por ejemplo. Pero echemos un vistazo más de cerca a esta pequeña pero importante tarea.
Empecemos por cambiar el tipo de datos de cadena a datetime
. La mayoría de las veces, lo necesitará para trabajar con series temporales. Puedes realizar esta operación utilizando el método .to_datetime()
:
Para convertir una cadena en un bool
- utilice el método .map()
en la columna cuyos valores desea cambiar:
Por ejemplo, si tiene una columna de precio que se parece a "$198,800" y quiere convertirla en un float
- debe crear funciones de transformación personalizadas:
import pandas as pd import re # Create simple dataset df = pd.DataFrame(data={'Price':['$4,122.94', '$1,002.3']}) # Create a custom function to transform data # x - value from column def price2int(x): return float(re.sub(r'[\$\,]', '', x)) # Use custom transformation on a column df['Price'] = df['Price'].apply(price2int)
Tarea
Lea el conjunto de datos sales_data_types.csv
y cambie el tipo de datos de la columna Active
de str
a bool
.
¡Gracias por tus comentarios!
Ya sabe cómo cambiar el tipo de datos de cadena a número, por ejemplo. Pero echemos un vistazo más de cerca a esta pequeña pero importante tarea.
Empecemos por cambiar el tipo de datos de cadena a datetime
. La mayoría de las veces, lo necesitará para trabajar con series temporales. Puedes realizar esta operación utilizando el método .to_datetime()
:
Para convertir una cadena en un bool
- utilice el método .map()
en la columna cuyos valores desea cambiar:
Por ejemplo, si tiene una columna de precio que se parece a "$198,800" y quiere convertirla en un float
- debe crear funciones de transformación personalizadas:
import pandas as pd import re # Create simple dataset df = pd.DataFrame(data={'Price':['$4,122.94', '$1,002.3']}) # Create a custom function to transform data # x - value from column def price2int(x): return float(re.sub(r'[\$\,]', '', x)) # Use custom transformation on a column df['Price'] = df['Price'].apply(price2int)
Tarea
Lea el conjunto de datos sales_data_types.csv
y cambie el tipo de datos de la columna Active
de str
a bool
.