Lære Funksjonsutvalg vs. Funksjonsekstraksjon | Introduksjon til Dimensjonsreduksjon

Datasett med høy dimensjonalitet har ofte flere egenskaper enn nødvendig. Du kan redusere antall egenskaper ved hjelp av to hovedstrategier: egenskapsutvalg og egenskapsekstraksjon.

Egenskapsutvalg innebærer å beholde kun de viktigste opprinnelige egenskapene – som å velge dine favorittfrukter fra en kurv;
Egenskapsekstraksjon lager nye egenskaper ved å kombinere eller transformere de opprinnelige – som å blande alle fruktene til en smoothie.

Principal Component Analysis (PCA) er en vanlig metode for egenskapsekstraksjon, som du vil utforske nærmere senere.


              12345678910111213141516171819202122
            
import pandas as pd
from sklearn.decomposition import PCA

# Example dataset
data = {
    'height': [150, 160, 170, 180],
    'weight': [50, 60, 70, 80],
    'age':    [20, 25, 30, 35],
    'score':  [85, 90, 95, 100]
}
df = pd.DataFrame(data)

# Feature selection: pick only 'height' and 'weight'
selected_features = df[['height', 'weight']]
print("Selected features (feature selection):")
print(selected_features)

# Feature extraction: combine features using PCA (placeholder, details later)
pca = PCA(n_components=2)
extracted_features = pca.fit_transform(df)
print("\nExtracted features (feature extraction, via PCA):")
print(extracted_features)

Merk

PCA er en kraftig teknikk for egenskapsekstraksjon som lager nye egenskaper (hovedkomponenter) fra de opprinnelige dataene. Detaljene om hvordan PCA fungerer vil bli gjennomgått i kommende kapitler.

Reduksjon av antall funksjoner kan hjelpe deg med å se mønstre som ellers kan være skjult i høyere dimensjoner. Ved å bruke visualisering kan du plotte utvalgte funksjoner for å avdekke klynger eller trender tydeligere. For eksempel kan plotting av kun de mest relevante funksjonene med seaborn gjøre relasjoner i dataene dine mer synlige, noe som gjør det enklere å tolke og analysere.

Alt var klart?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 3

Spør AI

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Sveip for å vise menyen