Kursinnehåll
Pandas Första Steg
Pandas Första Steg
Lägger till en Ny Kolumn
Vi har lärt oss hur man skapar en DataFrame
. Nu ska vi utforska vad vi kan göra med den. Först skapar vi en kompakt DataFrame
bestående av 3 kolumner och 7 rader.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
Du kan utöka DataFrame genom att lägga till nya kolumner, och det vanligaste sättet att göra det är enligt följande:
python
dataframe
är namnet på vår befintliga DataFrame till vilken vi kommer att lägga till nya kolumner;name_of_new_column
är namnet du ger till den nya kolumnen du lägger till;value_1, value_2, value_3
är de värden som kommer att fylla den nya kolumnen.
Notera
Namnet på den nya kolumnen bör vara omslutet av citattecken och inneslutet i hakparenteser, såsom
['NewColumnName']
. Värdena som tilldelas den nya kolumnen bör också vara inom hakparenteser, till exempeldata['NewColumnName'] = [value1, value2, value3]
. Om värdena är numeriska kan de skrivas utan citattecken, som[1, 2, 3]
. Om värdena är strängar bör varje vara omslutet av citattecken, som['A', 'B', 'C']
.
Nu ska vi lägga till en 'population'
kolumn till vår redan existerande countries
DataFrame.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Du kan också använda punktnotation (t.ex. df.column
) för åtkomst till befintliga kolumner, men det kan inte användas för att skapa nya kolumner. Använd alltid hakparenteser (t.ex. df['column']
) för detta ändamål.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Som förväntat skapades inte kolumnen 'population'
eftersom Pandas inte tillåter att kolumner skapas med denna metod.
Tack för dina kommentarer!