Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Adicionando uma Nova Coluna | Os Primeiros Passos
Primeiros Passos com Pandas
course content

Conteúdo do Curso

Primeiros Passos com Pandas

Primeiros Passos com Pandas

1. Os Primeiros Passos
2. Lendo Arquivos no Pandas
3. Analisando os Dados

book
Adicionando uma Nova Coluna

Aprendemos como criar um DataFrame. Agora vamos explorar o que podemos fazer com ele. Primeiro, vamos criar um DataFrame compacto consistindo de 3 colunas e 7 linhas.

1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
copy

Você pode expandir o DataFrame adicionando novas colunas, e a maneira mais comum de fazer isso é a seguinte:

  • dataframe é o nome do nosso DataFrame existente ao qual vamos adicionar novas colunas;

  • name_of_new_column é o nome que você está dando à nova coluna que está adicionando;

  • value_1, value_2, value_3 são os valores que irão preencher a nova coluna.

Nota

O nome da nova coluna deve estar entre aspas e entre colchetes, como ['NewColumnName']. Os valores atribuídos à nova coluna também devem estar entre colchetes, por exemplo, data['NewColumnName'] = [value1, value2, value3]. Se os valores forem numéricos, eles podem ser escritos sem aspas, como [1, 2, 3]. Se os valores forem strings, cada um deve estar entre aspas, como ['A', 'B', 'C'].

Agora, vamos adicionar uma coluna 'population' ao nosso DataFrame countries já existente.

12345678
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
copy

Você também pode usar a notação de ponto (por exemplo, df.column) para acessar colunas existentes, mas ela não pode ser usada para criar novas colunas. Sempre use colchetes (por exemplo, df['column']) para esse propósito.

12345678
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
copy

Como esperado, a coluna 'population' não foi criada, pois o Pandas não permite que colunas sejam criadas usando essa abordagem.

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 7
We're sorry to hear that something went wrong. What happened?
some-alt