Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Piirteiden Valinta vs. Piirteiden Uutto | Ulottuvuuksien Vähentämisen Perusteet
Ulottuvuuksien Vähentäminen PCA:lla

bookPiirteiden Valinta vs. Piirteiden Uutto

Korkean ulottuvuuden tietoaineistoissa on usein enemmän piirteitä kuin tarvitaan. Piirteiden määrää voidaan vähentää kahdella päästrategialla: piirteen valinta ja piirteen poiminta.

  • Piirteen valinta tarkoittaa vain tärkeimpien alkuperäisten piirteiden säilyttämistä – kuten valitset suosikkihedelmäsi korista;
  • Piirteen poiminta luo uusia piirteitä yhdistämällä tai muuntamalla alkuperäisiä – kuten sekoitat kaikki hedelmät smoothieksi.

Principal Component Analysis (PCA) on yleinen piirteen poimintamenetelmä, johon perehdyt tarkemmin myöhemmin.

12345678910111213141516171819202122
import pandas as pd from sklearn.decomposition import PCA # Example dataset data = { 'height': [150, 160, 170, 180], 'weight': [50, 60, 70, 80], 'age': [20, 25, 30, 35], 'score': [85, 90, 95, 100] } df = pd.DataFrame(data) # Feature selection: pick only 'height' and 'weight' selected_features = df[['height', 'weight']] print("Selected features (feature selection):") print(selected_features) # Feature extraction: combine features using PCA (placeholder, details later) pca = PCA(n_components=2) extracted_features = pca.fit_transform(df) print("\nExtracted features (feature extraction, via PCA):") print(extracted_features)
copy
Note
Huomio

PCA on tehokas piirteen poimintatekniikka, joka luo alkuperäisestä datasta uusia piirteitä (pääkomponentteja). Tarkempi kuvaus PCA:n toiminnasta käsitellään tulevissa luvuissa.

Ominaisuuksien määrän vähentäminen voi auttaa havaitsemaan kuvioita, jotka saattavat olla piilossa korkeammissa ulottuvuuksissa. Visualisoinnin avulla voit piirtää valitut ominaisuudet ja paljastaa klustereita tai trendejä selkeämmin. Esimerkiksi piirtämällä vain merkityksellisimmät ominaisuudet seaborn-kirjastolla, voit tuoda esiin datan välisiä suhteita, mikä helpottaa tulkintaa ja analysointia.

question mark

Mikä väite kuvaa parhaiten ominaisuuksien valinnan ja ominaisuuksien poiminnan eroa ulottuvuuksien vähentämisessä?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 3

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain more about how PCA works for feature extraction?

What are some other common feature selection methods?

How do I decide whether to use feature selection or feature extraction?

Awesome!

Completion rate improved to 8.33

bookPiirteiden Valinta vs. Piirteiden Uutto

Pyyhkäise näyttääksesi valikon

Korkean ulottuvuuden tietoaineistoissa on usein enemmän piirteitä kuin tarvitaan. Piirteiden määrää voidaan vähentää kahdella päästrategialla: piirteen valinta ja piirteen poiminta.

  • Piirteen valinta tarkoittaa vain tärkeimpien alkuperäisten piirteiden säilyttämistä – kuten valitset suosikkihedelmäsi korista;
  • Piirteen poiminta luo uusia piirteitä yhdistämällä tai muuntamalla alkuperäisiä – kuten sekoitat kaikki hedelmät smoothieksi.

Principal Component Analysis (PCA) on yleinen piirteen poimintamenetelmä, johon perehdyt tarkemmin myöhemmin.

12345678910111213141516171819202122
import pandas as pd from sklearn.decomposition import PCA # Example dataset data = { 'height': [150, 160, 170, 180], 'weight': [50, 60, 70, 80], 'age': [20, 25, 30, 35], 'score': [85, 90, 95, 100] } df = pd.DataFrame(data) # Feature selection: pick only 'height' and 'weight' selected_features = df[['height', 'weight']] print("Selected features (feature selection):") print(selected_features) # Feature extraction: combine features using PCA (placeholder, details later) pca = PCA(n_components=2) extracted_features = pca.fit_transform(df) print("\nExtracted features (feature extraction, via PCA):") print(extracted_features)
copy
Note
Huomio

PCA on tehokas piirteen poimintatekniikka, joka luo alkuperäisestä datasta uusia piirteitä (pääkomponentteja). Tarkempi kuvaus PCA:n toiminnasta käsitellään tulevissa luvuissa.

Ominaisuuksien määrän vähentäminen voi auttaa havaitsemaan kuvioita, jotka saattavat olla piilossa korkeammissa ulottuvuuksissa. Visualisoinnin avulla voit piirtää valitut ominaisuudet ja paljastaa klustereita tai trendejä selkeämmin. Esimerkiksi piirtämällä vain merkityksellisimmät ominaisuudet seaborn-kirjastolla, voit tuoda esiin datan välisiä suhteita, mikä helpottaa tulkintaa ja analysointia.

question mark

Mikä väite kuvaa parhaiten ominaisuuksien valinnan ja ominaisuuksien poiminnan eroa ulottuvuuksien vähentämisessä?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 3
some-alt