Відбір Ознак проти Видобування Ознак
Свайпніть щоб показати меню
Набори даних з великою кількістю вимірів часто містять більше ознак, ніж потрібно. Зменшити кількість ознак можна двома основними стратегіями: відбір ознак та видобування ознак.
- Відбір ознак означає збереження лише найважливіших початкових ознак — як вибір улюблених фруктів із кошика;
- Видобування ознак створює нові ознаки шляхом комбінування або перетворення початкових — як приготування смузі з усіх фруктів.
Аналіз головних компонент (PCA) — це поширений метод видобування ознак, який ви детально розглянете пізніше.
12345678910111213141516171819202122import pandas as pd from sklearn.decomposition import PCA # Example dataset data = { 'height': [150, 160, 170, 180], 'weight': [50, 60, 70, 80], 'age': [20, 25, 30, 35], 'score': [85, 90, 95, 100] } df = pd.DataFrame(data) # Feature selection: pick only 'height' and 'weight' selected_features = df[['height', 'weight']] print("Selected features (feature selection):") print(selected_features) # Feature extraction: combine features using PCA (placeholder, details later) pca = PCA(n_components=2) extracted_features = pca.fit_transform(df) print("\nExtracted features (feature extraction, via PCA):") print(extracted_features)
PCA — це потужний метод видобування ознак, який створює нові ознаки (головні компоненти) на основі ваших початкових даних. Деталі роботи PCA будуть розглянуті у наступних розділах.
Зменшення кількості ознак допомагає виявити закономірності, які можуть бути приховані у вищих вимірах. За допомогою візуалізації можна побудувати графіки вибраних ознак, щоб чіткіше побачити кластери або тренди. Наприклад, побудова графіків лише найбільш релевантних ознак за допомогою seaborn дозволяє виділити взаємозв'язки у ваших даних, що спрощує їх інтерпретацію та аналіз.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат