Conteúdo do Curso
Pré-processamento de Dados
Pré-processamento de Dados
Alterando o Tipo de Dados
Você já sabe como alterar o tipo de dado de string para número, por exemplo. Mas vamos examinar com mais atenção essa tarefa pequena, porém importante.
Vamos começar mudando o tipo de dado de string para datetime
. Na maioria das vezes, você precisará disso para trabalhar com séries temporais. Você pode realizar essa operação utilizando o método .to_datetime()
:
Para converter uma string para um bool
, use o método .map()
na coluna cujos valores você deseja alterar:
Por exemplo, se você possui uma coluna de preços que apresenta valores como "$198,800" e deseja convertê-los em float
, você deverá criar funções personalizadas de transformação:
import pandas as pd import re # Create simple dataset df = pd.DataFrame(data={'Price':['$4,122.94', '$1,002.3']}) # Create a custom function to transform data # x - value from column def price2int(x): return float(re.sub(r'[\$\,]', '', x)) # Use custom transformation on a column df['Price'] = df['Price'].apply(price2int)
Swipe to show code editor
Leia o conjunto de dados sales_data_types.csv
e altere o tipo de dado na coluna Active
de str
para bool
.
Obrigado pelo seu feedback!
Alterando o Tipo de Dados
Você já sabe como alterar o tipo de dado de string para número, por exemplo. Mas vamos examinar com mais atenção essa tarefa pequena, porém importante.
Vamos começar mudando o tipo de dado de string para datetime
. Na maioria das vezes, você precisará disso para trabalhar com séries temporais. Você pode realizar essa operação utilizando o método .to_datetime()
:
Para converter uma string para um bool
, use o método .map()
na coluna cujos valores você deseja alterar:
Por exemplo, se você possui uma coluna de preços que apresenta valores como "$198,800" e deseja convertê-los em float
, você deverá criar funções personalizadas de transformação:
import pandas as pd import re # Create simple dataset df = pd.DataFrame(data={'Price':['$4,122.94', '$1,002.3']}) # Create a custom function to transform data # x - value from column def price2int(x): return float(re.sub(r'[\$\,]', '', x)) # Use custom transformation on a column df['Price'] = df['Price'].apply(price2int)
Swipe to show code editor
Leia o conjunto de dados sales_data_types.csv
e altere o tipo de dado na coluna Active
de str
para bool
.
Obrigado pelo seu feedback!
Alterando o Tipo de Dados
Você já sabe como alterar o tipo de dado de string para número, por exemplo. Mas vamos examinar com mais atenção essa tarefa pequena, porém importante.
Vamos começar mudando o tipo de dado de string para datetime
. Na maioria das vezes, você precisará disso para trabalhar com séries temporais. Você pode realizar essa operação utilizando o método .to_datetime()
:
Para converter uma string para um bool
, use o método .map()
na coluna cujos valores você deseja alterar:
Por exemplo, se você possui uma coluna de preços que apresenta valores como "$198,800" e deseja convertê-los em float
, você deverá criar funções personalizadas de transformação:
import pandas as pd import re # Create simple dataset df = pd.DataFrame(data={'Price':['$4,122.94', '$1,002.3']}) # Create a custom function to transform data # x - value from column def price2int(x): return float(re.sub(r'[\$\,]', '', x)) # Use custom transformation on a column df['Price'] = df['Price'].apply(price2int)
Swipe to show code editor
Leia o conjunto de dados sales_data_types.csv
e altere o tipo de dado na coluna Active
de str
para bool
.
Obrigado pelo seu feedback!
Você já sabe como alterar o tipo de dado de string para número, por exemplo. Mas vamos examinar com mais atenção essa tarefa pequena, porém importante.
Vamos começar mudando o tipo de dado de string para datetime
. Na maioria das vezes, você precisará disso para trabalhar com séries temporais. Você pode realizar essa operação utilizando o método .to_datetime()
:
Para converter uma string para um bool
, use o método .map()
na coluna cujos valores você deseja alterar:
Por exemplo, se você possui uma coluna de preços que apresenta valores como "$198,800" e deseja convertê-los em float
, você deverá criar funções personalizadas de transformação:
import pandas as pd import re # Create simple dataset df = pd.DataFrame(data={'Price':['$4,122.94', '$1,002.3']}) # Create a custom function to transform data # x - value from column def price2int(x): return float(re.sub(r'[\$\,]', '', x)) # Use custom transformation on a column df['Price'] = df['Price'].apply(price2int)
Swipe to show code editor
Leia o conjunto de dados sales_data_types.csv
e altere o tipo de dado na coluna Active
de str
para bool
.