Cursusinhoud
Pandas Eerste Stappen
Pandas Eerste Stappen
Een Nieuwe Kolom Toevoegen
We hebben geleerd hoe we een DataFrame
kunnen maken. Laten we nu verkennen wat we ermee kunnen doen. Eerst maken we een compact DataFrame
bestaande uit 3 kolommen en 7 rijen.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
Je kunt het DataFrame uitbreiden door nieuwe kolommen toe te voegen, en de meest gebruikelijke manier om dit te doen is als volgt:
python
dataframe
is de naam van ons bestaande DataFrame waaraan we nieuwe kolommen zullen toevoegen;name_of_new_column
is de naam die je geeft aan de nieuwe kolom die je toevoegt;value_1, value_2, value_3
zijn de waarden die de nieuwe kolom zullen vullen.
Opmerking
De naam van de nieuwe kolom moet tussen aanhalingstekens staan en tussen vierkante haken worden geplaatst, zoals
['NewColumnName']
. De waarden die aan de nieuwe kolom worden toegewezen, moeten ook binnen vierkante haken staan, bijvoorbeelddata['NewColumnName'] = [value1, value2, value3]
. Als de waarden numeriek zijn, kunnen ze zonder aanhalingstekens worden geschreven, zoals[1, 2, 3]
. Als de waarden strings zijn, moet elk tussen aanhalingstekens staan, zoals['A', 'B', 'C']
.
Nu voegen we een 'population'
kolom toe aan onze reeds bestaande countries
DataFrame.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Je kunt ook puntnotatie gebruiken (bijv. df.column
) voor toegang tot bestaande kolommen, maar het kan niet worden gebruikt om nieuwe kolommen te maken. Gebruik hiervoor altijd vierkante haken (bijv. df['column']
).
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Zoals verwacht werd de 'population'
kolom niet aangemaakt omdat Pandas niet toestaat dat kolommen op deze manier worden aangemaakt.
Bedankt voor je feedback!