Conteúdo do Curso
Primeiros Passos com Pandas
Primeiros Passos com Pandas
Arquivos CSV
Como o pandas
é a biblioteca de referência para análise e manipulação de dados, uma de suas principais características é a capacidade de ler e escrever vários tipos de arquivos, incluindo arquivos CSV.
Um arquivo CSV (Comma-Separated Values) é um arquivo de texto simples usado para armazenar dados tabulares, onde cada linha representa um registro e as colunas são separadas por vírgulas.
Um arquivo CSV pode conter os seguintes dados:
- Números: valores inteiros ou decimais (por exemplo,
42
,3.14
); - Texto: strings ou dados categóricos (por exemplo,
John
,Active
); - Datas/Tempos: timestamps (por exemplo,
2023-12-30
); - Booleanos: valores lógicos (
True
,False
).
Cada linha deve ter o mesmo número de colunas, e a primeira linha geralmente contém os cabeçalhos das colunas.
Funções como read_csv()
e to_csv()
são úteis para lidar com dados CSV.
A sintaxe básica de read_csv()
e os principais parâmetros são os seguintes:
filepath_or_buffer
: caminho para o arquivo CSV (string ou URL);sep
: delimitador (o padrão é uma vírgula,
);header
: número da linha a ser usada como cabeçalhos das colunas (o padrão é a primeira linha);names
: Lista de nomes de colunas a serem usados;usecols
: colunas a serem lidas (subconjunto de colunas).
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Nota
Certifique-se de que o link do conjunto de dados esteja entre aspas.
A sintaxe básica de to_csv()
e os principais parâmetros são os seguintes:
path_or_buf
: caminho do arquivo ou objeto onde o CSV deve ser escrito;sep
: delimitador para separar valores (o padrão é uma vírgula,
);columns
: subconjunto de colunas a serem escritas (o padrão é todas as colunas);header
: se deve incluir os nomes das colunas como cabeçalho (o padrão éTrue
);index
: se deve escrever os índices das linhas no arquivo (o padrão éTrue
).
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
- Leia o arquivo CSV em um DataFrame.
- Exiba o conteúdo na sua tela.
Solução
Obrigado pelo seu feedback!
Arquivos CSV
Como o pandas
é a biblioteca de referência para análise e manipulação de dados, uma de suas principais características é a capacidade de ler e escrever vários tipos de arquivos, incluindo arquivos CSV.
Um arquivo CSV (Comma-Separated Values) é um arquivo de texto simples usado para armazenar dados tabulares, onde cada linha representa um registro e as colunas são separadas por vírgulas.
Um arquivo CSV pode conter os seguintes dados:
- Números: valores inteiros ou decimais (por exemplo,
42
,3.14
); - Texto: strings ou dados categóricos (por exemplo,
John
,Active
); - Datas/Tempos: timestamps (por exemplo,
2023-12-30
); - Booleanos: valores lógicos (
True
,False
).
Cada linha deve ter o mesmo número de colunas, e a primeira linha geralmente contém os cabeçalhos das colunas.
Funções como read_csv()
e to_csv()
são úteis para lidar com dados CSV.
A sintaxe básica de read_csv()
e os principais parâmetros são os seguintes:
filepath_or_buffer
: caminho para o arquivo CSV (string ou URL);sep
: delimitador (o padrão é uma vírgula,
);header
: número da linha a ser usada como cabeçalhos das colunas (o padrão é a primeira linha);names
: Lista de nomes de colunas a serem usados;usecols
: colunas a serem lidas (subconjunto de colunas).
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Nota
Certifique-se de que o link do conjunto de dados esteja entre aspas.
A sintaxe básica de to_csv()
e os principais parâmetros são os seguintes:
path_or_buf
: caminho do arquivo ou objeto onde o CSV deve ser escrito;sep
: delimitador para separar valores (o padrão é uma vírgula,
);columns
: subconjunto de colunas a serem escritas (o padrão é todas as colunas);header
: se deve incluir os nomes das colunas como cabeçalho (o padrão éTrue
);index
: se deve escrever os índices das linhas no arquivo (o padrão éTrue
).
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
- Leia o arquivo CSV em um DataFrame.
- Exiba o conteúdo na sua tela.
Solução
Obrigado pelo seu feedback!