Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Відбір Ознак проти Видобування Ознак | Вступ до зниження розмірності
Зменшення Розмірності за Допомогою PCA

bookВідбір Ознак проти Видобування Ознак

Набори даних з великою кількістю вимірів часто містять більше ознак, ніж потрібно. Зменшити кількість ознак можна двома основними стратегіями: відбір ознак та видобування ознак.

  • Відбір ознак означає збереження лише найважливіших початкових ознак — як вибір улюблених фруктів із кошика;
  • Видобування ознак створює нові ознаки шляхом комбінування або перетворення початкових — як приготування смузі з усіх фруктів.

Аналіз головних компонент (PCA) — це поширений метод видобування ознак, який ви детально розглянете пізніше.

12345678910111213141516171819202122
import pandas as pd from sklearn.decomposition import PCA # Example dataset data = { 'height': [150, 160, 170, 180], 'weight': [50, 60, 70, 80], 'age': [20, 25, 30, 35], 'score': [85, 90, 95, 100] } df = pd.DataFrame(data) # Feature selection: pick only 'height' and 'weight' selected_features = df[['height', 'weight']] print("Selected features (feature selection):") print(selected_features) # Feature extraction: combine features using PCA (placeholder, details later) pca = PCA(n_components=2) extracted_features = pca.fit_transform(df) print("\nExtracted features (feature extraction, via PCA):") print(extracted_features)
copy
Note
Примітка

PCA — це потужний метод видобування ознак, який створює нові ознаки (головні компоненти) на основі ваших початкових даних. Деталі роботи PCA будуть розглянуті у наступних розділах.

Зменшення кількості ознак допомагає виявити закономірності, які можуть бути приховані у вищих вимірах. За допомогою візуалізації можна побудувати графіки вибраних ознак, щоб чіткіше побачити кластери або тренди. Наприклад, побудова графіків лише найбільш релевантних ознак за допомогою seaborn дозволяє виділити взаємозв'язки у ваших даних, що спрощує їх інтерпретацію та аналіз.

question mark

Яке твердження найкраще описує різницю між вибором ознак і вилученням ознак у зниженні розмірності?

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 3

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

Can you explain more about how PCA works for feature extraction?

What are some other common feature selection methods?

How do I decide whether to use feature selection or feature extraction?

Awesome!

Completion rate improved to 8.33

bookВідбір Ознак проти Видобування Ознак

Свайпніть щоб показати меню

Набори даних з великою кількістю вимірів часто містять більше ознак, ніж потрібно. Зменшити кількість ознак можна двома основними стратегіями: відбір ознак та видобування ознак.

  • Відбір ознак означає збереження лише найважливіших початкових ознак — як вибір улюблених фруктів із кошика;
  • Видобування ознак створює нові ознаки шляхом комбінування або перетворення початкових — як приготування смузі з усіх фруктів.

Аналіз головних компонент (PCA) — це поширений метод видобування ознак, який ви детально розглянете пізніше.

12345678910111213141516171819202122
import pandas as pd from sklearn.decomposition import PCA # Example dataset data = { 'height': [150, 160, 170, 180], 'weight': [50, 60, 70, 80], 'age': [20, 25, 30, 35], 'score': [85, 90, 95, 100] } df = pd.DataFrame(data) # Feature selection: pick only 'height' and 'weight' selected_features = df[['height', 'weight']] print("Selected features (feature selection):") print(selected_features) # Feature extraction: combine features using PCA (placeholder, details later) pca = PCA(n_components=2) extracted_features = pca.fit_transform(df) print("\nExtracted features (feature extraction, via PCA):") print(extracted_features)
copy
Note
Примітка

PCA — це потужний метод видобування ознак, який створює нові ознаки (головні компоненти) на основі ваших початкових даних. Деталі роботи PCA будуть розглянуті у наступних розділах.

Зменшення кількості ознак допомагає виявити закономірності, які можуть бути приховані у вищих вимірах. За допомогою візуалізації можна побудувати графіки вибраних ознак, щоб чіткіше побачити кластери або тренди. Наприклад, побудова графіків лише найбільш релевантних ознак за допомогою seaborn дозволяє виділити взаємозв'язки у ваших даних, що спрощує їх інтерпретацію та аналіз.

question mark

Яке твердження найкраще описує різницю між вибором ознак і вилученням ознак у зниженні розмірності?

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 3
some-alt