Lära Visualisering av Förklarad Varians och Komponentladdningar

Svep för att visa menyn

Efter att ha anpassat PCA är det viktigt att förstå hur mycket information (varians) varje huvudkomponent fångar. Förklarad varianskvot visar detta. Du kan även granska komponentladdningarna för att se hur ursprungliga variabler bidrar till varje huvudkomponent.


              1234567891011121314151617181920212223242526272829303132333435
            
import numpy as np
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt
import seaborn as sns

# Load the Iris dataset
data = load_iris()
X = data.data
feature_names = data.feature_names

# Standardize features (important for PCA)
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Apply PCA to reduce to 2 components
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X_scaled)

# Plot explained variance ratio
plt.figure(figsize=(6,4))
plt.bar(range(1, len(pca.explained_variance_ratio_)+1), pca.explained_variance_ratio_, alpha=0.7)
plt.ylabel('Explained Variance Ratio')
plt.xlabel('Principal Component')
plt.title('Explained Variance by Principal Components')
plt.show()

# Display component loadings as a heatmap
loadings = pd.DataFrame(pca.components_.T, columns=['PC1', 'PC2'], index=feature_names)
plt.figure(figsize=(6,4))
sns.heatmap(loadings, annot=True, cmap='coolwarm')
plt.title('Principal Component Loadings')
plt.show()

Stapeldiagrammet visar andelen varians som förklaras av varje huvudkomponent. Värmekartan visar laddningarna, som indikerar hur mycket varje ursprunglig variabel bidrar till varje huvudkomponent. Stora absoluta värden innebär att en variabel är viktig för den komponenten.

Var allt tydligt?

Tack för dina kommentarer!

Avsnitt 3. Kapitel 2

Fråga AI

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Avsnitt 3. Kapitel 2