Типи Даних
Кожен стовпець (ознака) у навчальному наборі має пов'язаний із ним тип даних. Ці типи даних можна згрупувати у числові, категоріальні та дату й(або) час.
На жаль, більшість алгоритмів машинного навчання добре працюють лише з числами. Тому необхідно знайти спосіб перетворення категоріальних даних і даних дати та часу на числа.
Щодо дати та часу, можна використовувати ознаки на кшталт 'year'
, 'month'
тощо, залежно від завдання. Ці ознаки є числовими значеннями, тому з ними не виникає проблем.
З категоріальними даними працювати дещо складніше.
Типи категоріальних даних
Категоріальні дані поділяються на два типи:
-
Порядкові дані — це тип категоріальних даних, у яких категорії мають природний порядок. Наприклад, рівень освіти (від початкової школи до Ph.D.) або оцінки (від дуже погано до дуже добре) тощо;
-
Номінативні дані — це тип категоріальних даних, які не мають природного порядку. Наприклад, ім'я, стать, країна походження тощо.
Як ви побачите у наступних розділах, перетворення порядкових і номінативних типів даних на числові значення відрізняється, тому їх потрібно розділяти.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 3.13
Типи Даних
Свайпніть щоб показати меню
Кожен стовпець (ознака) у навчальному наборі має пов'язаний із ним тип даних. Ці типи даних можна згрупувати у числові, категоріальні та дату й(або) час.
На жаль, більшість алгоритмів машинного навчання добре працюють лише з числами. Тому необхідно знайти спосіб перетворення категоріальних даних і даних дати та часу на числа.
Щодо дати та часу, можна використовувати ознаки на кшталт 'year'
, 'month'
тощо, залежно від завдання. Ці ознаки є числовими значеннями, тому з ними не виникає проблем.
З категоріальними даними працювати дещо складніше.
Типи категоріальних даних
Категоріальні дані поділяються на два типи:
-
Порядкові дані — це тип категоріальних даних, у яких категорії мають природний порядок. Наприклад, рівень освіти (від початкової школи до Ph.D.) або оцінки (від дуже погано до дуже добре) тощо;
-
Номінативні дані — це тип категоріальних даних, які не мають природного порядку. Наприклад, ім'я, стать, країна походження тощо.
Як ви побачите у наступних розділах, перетворення порядкових і номінативних типів даних на числові значення відрізняється, тому їх потрібно розділяти.
Дякуємо за ваш відгук!