Унікальні значення
Дані часто містять дублікати у DataFrame. Наприклад, у DataFrame countries стовпець 'continent' має повторювані значення. Існує метод, який дозволяє отримати масив унікальних значень з певного стовпця DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Далі застосуйте метод unique() до стовпців 'continent' та 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Іноді, замість отримання всіх унікальних значень, потрібно лише дізнатися, скільки різних значень міститься у стовпці. У таких випадках можна скористатися методом nunique(). Він повертає кількість унікальних записів у стовпці — не самі значення.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Вам надано DataFrame з назвою audi_cars.
Ваша мета — дослідити його дані та визначити унікальні значення за допомогою методів Pandas.
- Отримайте всі унікальні значення з колонки
'year'та збережіть їх у зміннійunique_years. - Отримайте всі унікальні значення з колонки
'fueltype'та збережіть їх у зміннійunique_fueltype. - Визначте кількість унікальних типів пального у колонці
'fueltype'за допомогою методу.nunique()та збережіть результат у зміннійcount_unique_fueltypes.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 3.03
Унікальні значення
Свайпніть щоб показати меню
Дані часто містять дублікати у DataFrame. Наприклад, у DataFrame countries стовпець 'continent' має повторювані значення. Існує метод, який дозволяє отримати масив унікальних значень з певного стовпця DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Далі застосуйте метод unique() до стовпців 'continent' та 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Іноді, замість отримання всіх унікальних значень, потрібно лише дізнатися, скільки різних значень міститься у стовпці. У таких випадках можна скористатися методом nunique(). Він повертає кількість унікальних записів у стовпці — не самі значення.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Вам надано DataFrame з назвою audi_cars.
Ваша мета — дослідити його дані та визначити унікальні значення за допомогою методів Pandas.
- Отримайте всі унікальні значення з колонки
'year'та збережіть їх у зміннійunique_years. - Отримайте всі унікальні значення з колонки
'fueltype'та збережіть їх у зміннійunique_fueltype. - Визначте кількість унікальних типів пального у колонці
'fueltype'за допомогою методу.nunique()та збережіть результат у зміннійcount_unique_fueltypes.
Рішення
Дякуємо за ваш відгук!
single