Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Visualisering av Forklart Varians og Komponentlaster | Implementering av PCA i Python
Dimensjonsreduksjon med PCA

bookVisualisering av Forklart Varians og Komponentlaster

Etter å ha tilpasset PCA, er det viktig å forstå hvor mye informasjon (varians) hver hovedkomponent fanger opp. Forklart varians-forhold viser dette. Du kan også undersøke komponentlaster for å se hvordan de opprinnelige egenskapene bidrar til hver hovedkomponent.

1234567891011121314151617181920212223242526272829303132333435
import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.preprocessing import StandardScaler from sklearn.decomposition import PCA import matplotlib.pyplot as plt import seaborn as sns # Load the Iris dataset data = load_iris() X = data.data feature_names = data.feature_names # Standardize features (important for PCA) scaler = StandardScaler() X_scaled = scaler.fit_transform(X) # Apply PCA to reduce to 2 components pca = PCA(n_components=2) X_pca = pca.fit_transform(X_scaled) # Plot explained variance ratio plt.figure(figsize=(6,4)) plt.bar(range(1, len(pca.explained_variance_ratio_)+1), pca.explained_variance_ratio_, alpha=0.7) plt.ylabel('Explained Variance Ratio') plt.xlabel('Principal Component') plt.title('Explained Variance by Principal Components') plt.show() # Display component loadings as a heatmap loadings = pd.DataFrame(pca.components_.T, columns=['PC1', 'PC2'], index=feature_names) plt.figure(figsize=(6,4)) sns.heatmap(loadings, annot=True, cmap='coolwarm') plt.title('Principal Component Loadings') plt.show()
copy

Søylediagrammet viser andelen varians som forklares av hver hovedkomponent. Varmekartet viser laster, som indikerer hvor mye hver opprinnelig egenskap bidrar til hver hovedkomponent. Store absolutte verdier betyr at en egenskap er viktig for den komponenten.

question mark

Hva indikerer en stor absoluttverdi i en komponentlastmatrise om forholdet mellom en variabel og en hovedkomponent i PCA

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 2

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Suggested prompts:

Can you explain how to interpret the explained variance ratio in PCA?

What do the component loadings tell us about the original features?

How can I decide how many principal components to keep?

Awesome!

Completion rate improved to 8.33

bookVisualisering av Forklart Varians og Komponentlaster

Sveip for å vise menyen

Etter å ha tilpasset PCA, er det viktig å forstå hvor mye informasjon (varians) hver hovedkomponent fanger opp. Forklart varians-forhold viser dette. Du kan også undersøke komponentlaster for å se hvordan de opprinnelige egenskapene bidrar til hver hovedkomponent.

1234567891011121314151617181920212223242526272829303132333435
import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.preprocessing import StandardScaler from sklearn.decomposition import PCA import matplotlib.pyplot as plt import seaborn as sns # Load the Iris dataset data = load_iris() X = data.data feature_names = data.feature_names # Standardize features (important for PCA) scaler = StandardScaler() X_scaled = scaler.fit_transform(X) # Apply PCA to reduce to 2 components pca = PCA(n_components=2) X_pca = pca.fit_transform(X_scaled) # Plot explained variance ratio plt.figure(figsize=(6,4)) plt.bar(range(1, len(pca.explained_variance_ratio_)+1), pca.explained_variance_ratio_, alpha=0.7) plt.ylabel('Explained Variance Ratio') plt.xlabel('Principal Component') plt.title('Explained Variance by Principal Components') plt.show() # Display component loadings as a heatmap loadings = pd.DataFrame(pca.components_.T, columns=['PC1', 'PC2'], index=feature_names) plt.figure(figsize=(6,4)) sns.heatmap(loadings, annot=True, cmap='coolwarm') plt.title('Principal Component Loadings') plt.show()
copy

Søylediagrammet viser andelen varians som forklares av hver hovedkomponent. Varmekartet viser laster, som indikerer hvor mye hver opprinnelig egenskap bidrar til hver hovedkomponent. Store absolutte verdier betyr at en egenskap er viktig for den komponenten.

question mark

Hva indikerer en stor absoluttverdi i en komponentlastmatrise om forholdet mellom en variabel og en hovedkomponent i PCA

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 2
some-alt