Conteúdo do Curso
Pré-processamento de Dados
Pré-processamento de Dados
Tipos de Dados
A principal ferramenta que usaremos para manipular dados é o pandas
. Podemos começar imediatamente carregando os dados:
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv') print(df.head())
Como você sabe, cada conjunto de dados pode conter muitos tipos de dados diferentes, por exemplo, numéricos (inteiros, números de ponto flutuante), cadeias de caracteres (str) e data/hora (datetime). Para descobrir que tipo de dado uma coluna possui, você pode usar a propriedade .dtypes
:
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv') print(df.dtypes)
Digamos que você tenha uma coluna com valores numéricos, mas em formato de string, e queira mudar o tipo de dado para numérico. Para fazer isso, utilize o método .astype()
:
Tarefa
Leia o conjunto de dados penguins.csv
e altere o tipo de dado na coluna body_mass_g
de float
para int
.
Não modifique o código inicial, apenas substitua os espaços ___
pelo código correto.
Depois de concluir essa tarefa, clique no botão abaixo do código para verificar sua solução.
Obrigado pelo seu feedback!
Tipos de Dados
A principal ferramenta que usaremos para manipular dados é o pandas
. Podemos começar imediatamente carregando os dados:
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv') print(df.head())
Como você sabe, cada conjunto de dados pode conter muitos tipos de dados diferentes, por exemplo, numéricos (inteiros, números de ponto flutuante), cadeias de caracteres (str) e data/hora (datetime). Para descobrir que tipo de dado uma coluna possui, você pode usar a propriedade .dtypes
:
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv') print(df.dtypes)
Digamos que você tenha uma coluna com valores numéricos, mas em formato de string, e queira mudar o tipo de dado para numérico. Para fazer isso, utilize o método .astype()
:
Tarefa
Leia o conjunto de dados penguins.csv
e altere o tipo de dado na coluna body_mass_g
de float
para int
.
Não modifique o código inicial, apenas substitua os espaços ___
pelo código correto.
Depois de concluir essa tarefa, clique no botão abaixo do código para verificar sua solução.
Obrigado pelo seu feedback!
Tipos de Dados
A principal ferramenta que usaremos para manipular dados é o pandas
. Podemos começar imediatamente carregando os dados:
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv') print(df.head())
Como você sabe, cada conjunto de dados pode conter muitos tipos de dados diferentes, por exemplo, numéricos (inteiros, números de ponto flutuante), cadeias de caracteres (str) e data/hora (datetime). Para descobrir que tipo de dado uma coluna possui, você pode usar a propriedade .dtypes
:
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv') print(df.dtypes)
Digamos que você tenha uma coluna com valores numéricos, mas em formato de string, e queira mudar o tipo de dado para numérico. Para fazer isso, utilize o método .astype()
:
Tarefa
Leia o conjunto de dados penguins.csv
e altere o tipo de dado na coluna body_mass_g
de float
para int
.
Não modifique o código inicial, apenas substitua os espaços ___
pelo código correto.
Depois de concluir essa tarefa, clique no botão abaixo do código para verificar sua solução.
Obrigado pelo seu feedback!
A principal ferramenta que usaremos para manipular dados é o pandas
. Podemos começar imediatamente carregando os dados:
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv') print(df.head())
Como você sabe, cada conjunto de dados pode conter muitos tipos de dados diferentes, por exemplo, numéricos (inteiros, números de ponto flutuante), cadeias de caracteres (str) e data/hora (datetime). Para descobrir que tipo de dado uma coluna possui, você pode usar a propriedade .dtypes
:
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv') print(df.dtypes)
Digamos que você tenha uma coluna com valores numéricos, mas em formato de string, e queira mudar o tipo de dado para numérico. Para fazer isso, utilize o método .astype()
:
Tarefa
Leia o conjunto de dados penguins.csv
e altere o tipo de dado na coluna body_mass_g
de float
para int
.
Não modifique o código inicial, apenas substitua os espaços ___
pelo código correto.
Depois de concluir essa tarefa, clique no botão abaixo do código para verificar sua solução.