Унікальні значення
Дані часто дублюються у DataFrame. Наприклад, у DataFrame countries стовпець 'continent' містить повторювані значення. Існує метод, який дозволяє отримати масив унікальних значень з певного стовпця DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Далі застосуйте метод unique() до стовпців 'continent' та 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Для підрахунку кількості унікальних значень у певному стовпці використовуйте метод nunique():
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Вам надано DataFrame з назвою audi_cars.
- Визначте всі унікальні значення у стовпці
'year'та збережіть результат у зміннійunique_years. - Визначте всі унікальні значення у стовпці
'fueltype'та збережіть результат у зміннійunique_fueltype. - Визначте кількість унікальних типів пального та збережіть результат у змінній
count_unique_fueltypes.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
How does the nunique() method work?
Can I use nunique() on multiple columns at once?
What is the difference between unique() and nunique()?
Awesome!
Completion rate improved to 3.03
Унікальні значення
Свайпніть щоб показати меню
Дані часто дублюються у DataFrame. Наприклад, у DataFrame countries стовпець 'continent' містить повторювані значення. Існує метод, який дозволяє отримати масив унікальних значень з певного стовпця DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Далі застосуйте метод unique() до стовпців 'continent' та 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Для підрахунку кількості унікальних значень у певному стовпці використовуйте метод nunique():
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Вам надано DataFrame з назвою audi_cars.
- Визначте всі унікальні значення у стовпці
'year'та збережіть результат у зміннійunique_years. - Визначте всі унікальні значення у стовпці
'fueltype'та збережіть результат у зміннійunique_fueltype. - Визначте кількість унікальних типів пального та збережіть результат у змінній
count_unique_fueltypes.
Рішення
Дякуємо за ваш відгук!
single