Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Унікальні Значення | Аналіз Даних
Practice
Projects
Quizzes & Challenges
Quizzes
Challenges
/
Вступ до Pandas

bookУнікальні Значення

Дані часто дублюються у DataFrame. Наприклад, у DataFrame countries стовпець 'continent' містить повторювані значення. Існує метод, який отримує масив унікальних значень з певного стовпця DataFrame.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Далі застосуйте метод unique() до стовпців 'continent' та 'country':

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Іноді, замість отримання всіх унікальних значень, потрібно лише дізнатися, скільки різних значень міститься у стовпці. У таких випадках використовується метод nunique(). Він повертає кількість унікальних записів у стовпці — не самі значення.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Завдання

Swipe to start coding

Вам надано DataFrame з назвою audi_cars. Ваша мета — дослідити його дані та визначити унікальні значення за допомогою методів Pandas.

  1. Отримати всі унікальні значення з колонки 'year' та зберегти їх у змінній unique_years.
  2. Отримати всі унікальні значення з колонки 'fueltype' та зберегти їх у змінній unique_fueltype.
  3. Визначити кількість унікальних типів пального у колонці 'fueltype' за допомогою методу .nunique() та зберегти результат у змінній count_unique_fueltypes.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 15
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

What does the output of the nunique() method look like?

Can I use nunique() on multiple columns at once?

What happens if there are missing values in the column?

close

bookУнікальні Значення

Свайпніть щоб показати меню

Дані часто дублюються у DataFrame. Наприклад, у DataFrame countries стовпець 'continent' містить повторювані значення. Існує метод, який отримує масив унікальних значень з певного стовпця DataFrame.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Далі застосуйте метод unique() до стовпців 'continent' та 'country':

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Іноді, замість отримання всіх унікальних значень, потрібно лише дізнатися, скільки різних значень міститься у стовпці. У таких випадках використовується метод nunique(). Він повертає кількість унікальних записів у стовпці — не самі значення.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Завдання

Swipe to start coding

Вам надано DataFrame з назвою audi_cars. Ваша мета — дослідити його дані та визначити унікальні значення за допомогою методів Pandas.

  1. Отримати всі унікальні значення з колонки 'year' та зберегти їх у змінній unique_years.
  2. Отримати всі унікальні значення з колонки 'fueltype' та зберегти їх у змінній unique_fueltype.
  3. Визначити кількість унікальних типів пального у колонці 'fueltype' за допомогою методу .nunique() та зберегти результат у змінній count_unique_fueltypes.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 15
single

single

some-alt