Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Seleção de Características vs. Extração de Características | Introdução à Redução de Dimensionalidade
Redução de Dimensionalidade com PCA

bookSeleção de Características vs. Extração de Características

Conjuntos de dados de alta dimensionalidade frequentemente possuem mais características do que o necessário. É possível reduzir as características utilizando duas estratégias principais: seleção de características e extração de características.

  • Seleção de características consiste em manter apenas as características originais mais importantes – como escolher suas frutas favoritas em uma cesta;
  • Extração de características cria novas características ao combinar ou transformar as originais – como misturar todas as frutas em um smoothie.

A Análise de Componentes Principais (PCA) é um método comum de extração de características, que será explorado em detalhes posteriormente.

12345678910111213141516171819202122
import pandas as pd from sklearn.decomposition import PCA # Example dataset data = { 'height': [150, 160, 170, 180], 'weight': [50, 60, 70, 80], 'age': [20, 25, 30, 35], 'score': [85, 90, 95, 100] } df = pd.DataFrame(data) # Feature selection: pick only 'height' and 'weight' selected_features = df[['height', 'weight']] print("Selected features (feature selection):") print(selected_features) # Feature extraction: combine features using PCA (placeholder, details later) pca = PCA(n_components=2) extracted_features = pca.fit_transform(df) print("\nExtracted features (feature extraction, via PCA):") print(extracted_features)
copy
Note
Nota

PCA é uma técnica poderosa de extração de características que cria novas características (componentes principais) a partir dos seus dados originais. Os detalhes de como o PCA funciona serão abordados nos próximos capítulos.

Reduzir o número de variáveis pode ajudar a identificar padrões que podem estar ocultos em dimensões mais altas. Utilizando visualização, é possível plotar variáveis selecionadas para revelar agrupamentos ou tendências de forma mais clara. Por exemplo, ao plotar apenas as variáveis mais relevantes com seaborn, os relacionamentos nos dados se destacam, facilitando a interpretação e análise.

question mark

Qual afirmação melhor descreve a diferença entre seleção de variáveis e extração de variáveis na redução de dimensionalidade

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 3

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Awesome!

Completion rate improved to 8.33

bookSeleção de Características vs. Extração de Características

Deslize para mostrar o menu

Conjuntos de dados de alta dimensionalidade frequentemente possuem mais características do que o necessário. É possível reduzir as características utilizando duas estratégias principais: seleção de características e extração de características.

  • Seleção de características consiste em manter apenas as características originais mais importantes – como escolher suas frutas favoritas em uma cesta;
  • Extração de características cria novas características ao combinar ou transformar as originais – como misturar todas as frutas em um smoothie.

A Análise de Componentes Principais (PCA) é um método comum de extração de características, que será explorado em detalhes posteriormente.

12345678910111213141516171819202122
import pandas as pd from sklearn.decomposition import PCA # Example dataset data = { 'height': [150, 160, 170, 180], 'weight': [50, 60, 70, 80], 'age': [20, 25, 30, 35], 'score': [85, 90, 95, 100] } df = pd.DataFrame(data) # Feature selection: pick only 'height' and 'weight' selected_features = df[['height', 'weight']] print("Selected features (feature selection):") print(selected_features) # Feature extraction: combine features using PCA (placeholder, details later) pca = PCA(n_components=2) extracted_features = pca.fit_transform(df) print("\nExtracted features (feature extraction, via PCA):") print(extracted_features)
copy
Note
Nota

PCA é uma técnica poderosa de extração de características que cria novas características (componentes principais) a partir dos seus dados originais. Os detalhes de como o PCA funciona serão abordados nos próximos capítulos.

Reduzir o número de variáveis pode ajudar a identificar padrões que podem estar ocultos em dimensões mais altas. Utilizando visualização, é possível plotar variáveis selecionadas para revelar agrupamentos ou tendências de forma mais clara. Por exemplo, ao plotar apenas as variáveis mais relevantes com seaborn, os relacionamentos nos dados se destacam, facilitando a interpretação e análise.

question mark

Qual afirmação melhor descreve a diferença entre seleção de variáveis e extração de variáveis na redução de dimensionalidade

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 3
some-alt