Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Унікальні значення | Аналіз Даних
Вступ до Pandas

bookУнікальні значення

Дані часто містять дублікати у DataFrame. Наприклад, у DataFrame countries стовпець 'continent' має повторювані значення. Існує метод, який дозволяє отримати масив унікальних значень з певного стовпця DataFrame.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Далі застосуйте метод unique() до стовпців 'continent' та 'country':

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Іноді, замість отримання всіх унікальних значень, потрібно лише дізнатися, скільки різних значень міститься у стовпці. У таких випадках можна скористатися методом nunique(). Він повертає кількість унікальних записів у стовпці — не самі значення.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Завдання

Swipe to start coding

Вам надано DataFrame з назвою audi_cars. Ваша мета — дослідити його дані та визначити унікальні значення за допомогою методів Pandas.

  1. Отримайте всі унікальні значення з колонки 'year' та збережіть їх у змінній unique_years.
  2. Отримайте всі унікальні значення з колонки 'fueltype' та збережіть їх у змінній unique_fueltype.
  3. Визначте кількість унікальних типів пального у колонці 'fueltype' за допомогою методу .nunique() та збережіть результат у змінній count_unique_fueltypes.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 15
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

close

Awesome!

Completion rate improved to 3.03

bookУнікальні значення

Свайпніть щоб показати меню

Дані часто містять дублікати у DataFrame. Наприклад, у DataFrame countries стовпець 'continent' має повторювані значення. Існує метод, який дозволяє отримати масив унікальних значень з певного стовпця DataFrame.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Далі застосуйте метод unique() до стовпців 'continent' та 'country':

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Іноді, замість отримання всіх унікальних значень, потрібно лише дізнатися, скільки різних значень міститься у стовпці. У таких випадках можна скористатися методом nunique(). Він повертає кількість унікальних записів у стовпці — не самі значення.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Завдання

Swipe to start coding

Вам надано DataFrame з назвою audi_cars. Ваша мета — дослідити його дані та визначити унікальні значення за допомогою методів Pandas.

  1. Отримайте всі унікальні значення з колонки 'year' та збережіть їх у змінній unique_years.
  2. Отримайте всі унікальні значення з колонки 'fueltype' та збережіть їх у змінній unique_fueltype.
  3. Визначте кількість унікальних типів пального у колонці 'fueltype' за допомогою методу .nunique() та збережіть результат у змінній count_unique_fueltypes.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 15
single

single

some-alt