Conteúdo do Curso
Primeiros Passos com Pandas
Primeiros Passos com Pandas
Adicionando uma Nova Coluna
Aprendemos como criar um DataFrame
. Agora vamos explorar o que podemos fazer com ele. Primeiro, vamos criar um DataFrame
compacto consistindo de 3 colunas e 7 linhas.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
Você pode expandir o DataFrame adicionando novas colunas, e a maneira mais comum de fazer isso é a seguinte:
-
dataframe
é o nome do nosso DataFrame existente ao qual vamos adicionar novas colunas; -
name_of_new_column
é o nome que você está dando à nova coluna que está adicionando; -
value_1, value_2, value_3
são os valores que irão preencher a nova coluna.
Nota
O nome da nova coluna deve estar entre aspas e entre colchetes, como
['NewColumnName']
. Os valores atribuídos à nova coluna também devem estar entre colchetes, por exemplo,data['NewColumnName'] = [value1, value2, value3]
. Se os valores forem numéricos, eles podem ser escritos sem aspas, como[1, 2, 3]
. Se os valores forem strings, cada um deve estar entre aspas, como['A', 'B', 'C']
.
Agora, vamos adicionar uma coluna 'population'
ao nosso DataFrame countries
já existente.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Você também pode usar a notação de ponto (por exemplo, df.column
) para acessar colunas existentes, mas ela não pode ser usada para criar novas colunas. Sempre use colchetes (por exemplo, df['column']
) para esse propósito.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Como esperado, a coluna 'population'
não foi criada, pois o Pandas não permite que colunas sejam criadas usando essa abordagem.
Obrigado pelo seu feedback!