Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Типи Даних | Концепції Машинного Навчання
Вступ до ML з Використанням Scikit-learn

bookТипи Даних

Кожен стовпець (ознака) у навчальному наборі має пов'язаний із ним тип даних. Ці типи даних можна згрупувати у числові, категоріальні та дату й(або) час.

На жаль, більшість алгоритмів машинного навчання добре працюють лише з числами. Тому необхідно знайти спосіб перетворення категоріальних даних і даних дати та часу на числа.

Щодо дати та часу, можна використовувати ознаки на кшталт 'year', 'month' тощо, залежно від завдання. Ці ознаки є числовими значеннями, тому з ними не виникає проблем.

З категоріальними даними працювати дещо складніше.

Типи категоріальних даних

Категоріальні дані поділяються на два типи:

  • Порядкові дані — це тип категоріальних даних, у яких категорії мають природний порядок. Наприклад, рівень освіти (від початкової школи до Ph.D.) або оцінки (від дуже погано до дуже добре) тощо;

  • Номінативні дані — це тип категоріальних даних, які не мають природного порядку. Наприклад, ім'я, стать, країна походження тощо.

Як ви побачите у наступних розділах, перетворення порядкових і номінативних типів даних на числові значення відрізняється, тому їх потрібно розділяти.

question-icon

Відповідність ознаки та її типу даних.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Натисніть або перетягніть елементи та заповніть пропуски

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 4

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Awesome!

Completion rate improved to 3.13

bookТипи Даних

Свайпніть щоб показати меню

Кожен стовпець (ознака) у навчальному наборі має пов'язаний із ним тип даних. Ці типи даних можна згрупувати у числові, категоріальні та дату й(або) час.

На жаль, більшість алгоритмів машинного навчання добре працюють лише з числами. Тому необхідно знайти спосіб перетворення категоріальних даних і даних дати та часу на числа.

Щодо дати та часу, можна використовувати ознаки на кшталт 'year', 'month' тощо, залежно від завдання. Ці ознаки є числовими значеннями, тому з ними не виникає проблем.

З категоріальними даними працювати дещо складніше.

Типи категоріальних даних

Категоріальні дані поділяються на два типи:

  • Порядкові дані — це тип категоріальних даних, у яких категорії мають природний порядок. Наприклад, рівень освіти (від початкової школи до Ph.D.) або оцінки (від дуже погано до дуже добре) тощо;

  • Номінативні дані — це тип категоріальних даних, які не мають природного порядку. Наприклад, ім'я, стать, країна походження тощо.

Як ви побачите у наступних розділах, перетворення порядкових і номінативних типів даних на числові значення відрізняється, тому їх потрібно розділяти.

question-icon

Відповідність ознаки та її типу даних.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Натисніть або перетягніть елементи та заповніть пропуски

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 4
some-alt