Aprenda Seleção de Características vs. Extração de Características

Deslize para mostrar o menu

Conjuntos de dados de alta dimensionalidade frequentemente possuem mais características do que o necessário. É possível reduzir as características utilizando duas estratégias principais: seleção de características e extração de características.

Seleção de características consiste em manter apenas as características originais mais importantes – como escolher suas frutas favoritas em uma cesta;
Extração de características cria novas características ao combinar ou transformar as originais – como misturar todas as frutas em um smoothie.

A Análise de Componentes Principais (PCA) é um método comum de extração de características, que será explorado em detalhes posteriormente.


              12345678910111213141516171819202122
            
import pandas as pd
from sklearn.decomposition import PCA

# Example dataset
data = {
    'height': [150, 160, 170, 180],
    'weight': [50, 60, 70, 80],
    'age':    [20, 25, 30, 35],
    'score':  [85, 90, 95, 100]
}
df = pd.DataFrame(data)

# Feature selection: pick only 'height' and 'weight'
selected_features = df[['height', 'weight']]
print("Selected features (feature selection):")
print(selected_features)

# Feature extraction: combine features using PCA (placeholder, details later)
pca = PCA(n_components=2)
extracted_features = pca.fit_transform(df)
print("\nExtracted features (feature extraction, via PCA):")
print(extracted_features)

Nota

PCA é uma técnica poderosa de extração de características que cria novas características (componentes principais) a partir dos seus dados originais. Os detalhes de como o PCA funciona serão abordados nos próximos capítulos.

Reduzir o número de variáveis pode ajudar a identificar padrões que podem estar ocultos em dimensões mais altas. Utilizando visualização, é possível plotar variáveis selecionadas para revelar agrupamentos ou tendências de forma mais clara. Por exemplo, ao plotar apenas as variáveis mais relevantes com seaborn, os relacionamentos nos dados se destacam, facilitando a interpretação e análise.

Tudo estava claro?

Obrigado pelo seu feedback!

Seção 1. Capítulo 3

Pergunte à IA

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Seção 1. Capítulo 3