Типи Даних
Свайпніть щоб показати меню
Кожен стовпець (ознака) у навчальній вибірці має відповідний тип даних. Ці типи даних можна згрупувати як числові, категоріальні та дата і(або) час.
Більшість алгоритмів машинного навчання працюють ефективно лише з числовими даними, тому категоріальні та часові значення потрібно перетворювати на числа.
Для дати і часу можна виділяти такі ознаки, як 'year', 'month' та подібні, залежно від завдання. Вони вже є числовими значеннями, тому їх можна використовувати безпосередньо.
Категоріальні дані є трохи складнішими для обробки.
Типи категоріальних даних
Категоріальні дані поділяються на два типи:
-
Порядкові дані — це тип категоріальних даних, у яких категорії мають природний порядок. Наприклад, рівень освіти (від початкової школи до Ph.D.) або оцінки (від дуже погано до дуже добре) тощо;
-
Номінальні дані — це тип категоріальних даних, які не мають природного порядку. Наприклад, ім'я, стать, країна походження тощо.
Перетворення порядкових та номінальних типів даних у числові значення вимагає різних підходів, тому їх потрібно обробляти окремо.
Існують кращі способи перетворення дат у числові значення, які виходять за межі цього вступного курсу. Наприклад, якщо використовувати лише ознаку 'month', це не враховує, що 12 місяць насправді ближчий до 1, ніж до 9.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат