Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Ajouter une Nouvelle Colonne | Les Toutes Premières Étapes
Premiers Pas Avec Pandas
course content

Contenu du cours

Premiers Pas Avec Pandas

Premiers Pas Avec Pandas

1. Les Toutes Premières Étapes
2. Lecture de Fichiers dans Pandas
3. Analyser les Données

book
Ajouter une Nouvelle Colonne

Nous avons appris à créer un DataFrame. Maintenant, explorons ce que nous pouvons faire avec. Tout d'abord, nous allons créer un DataFrame compact composé de 3 colonnes et 7 lignes.

1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
copy

Vous pouvez étendre le DataFrame en ajoutant de nouvelles colonnes, et la manière la plus courante de le faire est la suivante :

  • dataframe est le nom de notre DataFrame existant auquel nous allons ajouter de nouvelles colonnes ;

  • name_of_new_column est le nom que vous donnez à la nouvelle colonne que vous ajoutez ;

  • value_1, value_2, value_3 sont les valeurs qui rempliront la nouvelle colonne.

Remarque

Le nom de la nouvelle colonne doit être entre guillemets et entouré de crochets, comme ['NewColumnName']. Les valeurs attribuées à la nouvelle colonne doivent également être entre crochets, par exemple, data['NewColumnName'] = [value1, value2, value3]. Si les valeurs sont numériques, elles peuvent être écrites sans guillemets, comme [1, 2, 3]. Si les valeurs sont des chaînes, chacune doit être entre guillemets, comme ['A', 'B', 'C'].

Maintenant, nous allons ajouter une colonne 'population' à notre DataFrame countries déjà existant.

12345678
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
copy

Vous pouvez également utiliser la notation par point (par exemple, df.column) pour accéder aux colonnes existantes, mais elle ne peut pas être utilisée pour créer de nouvelles colonnes. Utilisez toujours des crochets (par exemple, df['column']) à cette fin.

12345678
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
copy

Comme prévu, la colonne 'population' n'a pas été créée car Pandas n'autorise pas la création de colonnes en utilisant cette approche.

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 7
We're sorry to hear that something went wrong. What happened?
some-alt