Contenu du cours
Premiers Pas Avec Pandas
Premiers Pas Avec Pandas
Ajouter une Nouvelle Colonne
Nous avons appris à créer un DataFrame
. Maintenant, explorons ce que nous pouvons faire avec. Tout d'abord, nous allons créer un DataFrame
compact composé de 3 colonnes et 7 lignes.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
Vous pouvez étendre le DataFrame en ajoutant de nouvelles colonnes, et la manière la plus courante de le faire est la suivante :
-
dataframe
est le nom de notre DataFrame existant auquel nous allons ajouter de nouvelles colonnes ; -
name_of_new_column
est le nom que vous donnez à la nouvelle colonne que vous ajoutez ; -
value_1, value_2, value_3
sont les valeurs qui rempliront la nouvelle colonne.
Remarque
Le nom de la nouvelle colonne doit être entre guillemets et entouré de crochets, comme
['NewColumnName']
. Les valeurs attribuées à la nouvelle colonne doivent également être entre crochets, par exemple,data['NewColumnName'] = [value1, value2, value3]
. Si les valeurs sont numériques, elles peuvent être écrites sans guillemets, comme[1, 2, 3]
. Si les valeurs sont des chaînes, chacune doit être entre guillemets, comme['A', 'B', 'C']
.
Maintenant, nous allons ajouter une colonne 'population'
à notre DataFrame countries
déjà existant.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Vous pouvez également utiliser la notation par point (par exemple, df.column
) pour accéder aux colonnes existantes, mais elle ne peut pas être utilisée pour créer de nouvelles colonnes. Utilisez toujours des crochets (par exemple, df['column']
) à cette fin.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Comme prévu, la colonne 'population'
n'a pas été créée car Pandas n'autorise pas la création de colonnes en utilisant cette approche.
Merci pour vos commentaires !