Вивчайте Чому Масштабувати Дані?

Свайпніть щоб показати меню

Після обробки пропущених значень і кодування категоріальних ознак, набір даних не містить проблем, які могли б спричинити помилки в моделі. Однак залишається ще одна задача: різні масштаби ознак.

Ця проблема не призведе до помилок при подачі поточних даних у модель, але може суттєво погіршити роботу деяких ML-моделей.

Розглянемо приклад, де одна ознака — це 'age', діапазон значень від 18 до 50, а друга ознака — 'income', діапазон від $25,000 до $500,000. Очевидно, що різниця у десять років віку є значущішою, ніж різниця у десять доларів доходу.

Однак деякі моделі, наприклад k-NN (яку ми будемо використовувати в цьому курсі), можуть розглядати ці відмінності як однаково важливі. У результаті стовпець 'income' матиме набагато більший вплив на модель. Тому важливо, щоб ознаки мали приблизно однаковий діапазон значень, щоб k-NN працювала ефективно.

Інші моделі можуть бути менш чутливими до різних масштабів, але масштабування даних може суттєво підвищити швидкість обробки. Тому масштабування даних зазвичай включають як фінальний етап попередньої обробки.

Примітка

Як зазначалося вище, масштабування даних зазвичай є останнім кроком етапу попередньої обробки. Це пов'язано з тим, що зміни ознак після масштабування можуть зробити дані знову немасштабованими.

У наступному розділі буде розглянуто три найпоширеніші трансформери для масштабування даних: StandardScaler, MinMaxScaler та MaxAbsScaler.

Чому важливо масштабувати ознаки в моделях машинного навчання, таких як k-nearest neighbors (KNN)?

Виберіть правильну відповідь

Без масштабування ознаки з більшим масштабом можуть непропорційно впливати на результат моделі, що призводить до упереджених результатів.

Масштабування необхідне для того, щоб модель могла ефективніше працювати з пропущеними даними.

Масштабування зменшує складність моделі.

Масштабування потрібне для перетворення всіх даних у числовий формат, який можуть обробляти KNN та інші моделі.

Все було зрозуміло?

Дякуємо за ваш відгук!

Секція 1. Розділ 14

Запитати АІ

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Секція 1. Розділ 14