Hinzufügen Einer Neuen Spalte
Wir haben gelernt, wie man ein DataFrame
erstellt. Jetzt wollen wir erkunden, was wir damit machen können. Zuerst erstellen wir ein kompaktes DataFrame
, das aus 3 Spalten und 7 Zeilen besteht.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
Sie können das DataFrame erweitern, indem Sie neue Spalten hinzufügen, und die gebräuchlichste Methode, dies zu tun, ist wie folgt:
dataframe['name_of_new_column'] = [value_1, value_2, value_3]
-
dataframe
ist der Name unseres bestehenden DataFrames, dem wir neue Spalten hinzufügen; -
name_of_new_column
ist der Name, den Sie der neuen Spalte geben, die Sie hinzufügen; -
value_1, value_2, value_3
sind die Werte, die die neue Spalte füllen werden.
Hinweis
Der Name der neuen Spalte sollte in Anführungszeichen gesetzt und in eckige Klammern eingeschlossen werden, wie
['NewColumnName']
. Die der neuen Spalte zugewiesenen Werte sollten ebenfalls in eckigen Klammern stehen, zum Beispieldata['NewColumnName'] = [value1, value2, value3]
. Wenn die Werte numerisch sind, können sie ohne Anführungszeichen geschrieben werden, wie[1, 2, 3]
. Wenn die Werte Zeichenfolgen sind, sollte jede in Anführungszeichen gesetzt werden, wie['A', 'B', 'C']
.
Jetzt fügen wir unserer bereits bestehenden 'population'
DataFrame eine countries
-Spalte hinzu.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Sie können auch die Punktnotation (z.B. df.column
) verwenden, um auf vorhandene Spalten zuzugreifen, aber sie kann nicht verwendet werden, um neue Spalten zu erstellen. Verwenden Sie hierfür immer eckige Klammern (z.B. df['column']
).
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Wie erwartet wurde die 'population'
-Spalte nicht erstellt, da Pandas nicht erlaubt, Spalten auf diese Weise zu erstellen.
Danke für Ihr Feedback!