Зміст курсу
Перші Кроки з Pandas
Перші Кроки з Pandas
Додавання Нового Стовпця
Ми навчилися створювати DataFrame
. Тепер давайте дослідимо, що ми можемо з ним зробити. Спочатку ми створимо компактний DataFrame
, що складається з 3 колонок і 7 рядків.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
Ви можете розширити DataFrame, додаючи нові колонки, і найпоширеніший спосіб зробити це наступний:
-
dataframe
- це назва нашого існуючого DataFrame, до якого ми додамо нові колонки; -
name_of_new_column
- це назва, яку ви даєте новій колонці, яку додаєте; -
value_1, value_2, value_3
- це значення, які заповнять нову колонку.
Примітка
Назва нового стовпця повинна бути взята в лапки та обгорнута в квадратні дужки, наприклад,
['NewColumnName']
. Значення, призначені новому стовпцю, також повинні бути в квадратних дужках, наприклад,data['NewColumnName'] = [value1, value2, value3]
. Якщо значення є числовими, їх можна записати без лапок, як[1, 2, 3]
. Якщо значення є рядками, кожне з них повинно бути взято в лапки, як['A', 'B', 'C']
.
Тепер ми додамо стовпець 'population'
до нашого вже існуючого DataFrame countries
.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Ви також можете використовувати нотацію з крапкою (наприклад, df.column
) для доступу до існуючих стовпців, але її не можна використовувати для створення нових стовпців. Завжди використовуйте квадратні дужки (наприклад, df['column']
) для цієї мети.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
Як і очікувалося, стовпець 'population'
не був створений, оскільки Pandas не дозволяє створювати стовпці за допомогою цього підходу.
Дякуємо за ваш відгук!