Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Visualisering av Förklarad Varians och Komponentladdningar | Implementering av PCA i Python
Dimensionsreduktion med PCA

bookVisualisering av Förklarad Varians och Komponentladdningar

Efter att ha anpassat PCA är det viktigt att förstå hur mycket information (varians) varje huvudkomponent fångar. Förklarad varianskvot visar detta. Du kan även granska komponentladdningarna för att se hur ursprungliga variabler bidrar till varje huvudkomponent.

1234567891011121314151617181920212223242526272829303132333435
import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.preprocessing import StandardScaler from sklearn.decomposition import PCA import matplotlib.pyplot as plt import seaborn as sns # Load the Iris dataset data = load_iris() X = data.data feature_names = data.feature_names # Standardize features (important for PCA) scaler = StandardScaler() X_scaled = scaler.fit_transform(X) # Apply PCA to reduce to 2 components pca = PCA(n_components=2) X_pca = pca.fit_transform(X_scaled) # Plot explained variance ratio plt.figure(figsize=(6,4)) plt.bar(range(1, len(pca.explained_variance_ratio_)+1), pca.explained_variance_ratio_, alpha=0.7) plt.ylabel('Explained Variance Ratio') plt.xlabel('Principal Component') plt.title('Explained Variance by Principal Components') plt.show() # Display component loadings as a heatmap loadings = pd.DataFrame(pca.components_.T, columns=['PC1', 'PC2'], index=feature_names) plt.figure(figsize=(6,4)) sns.heatmap(loadings, annot=True, cmap='coolwarm') plt.title('Principal Component Loadings') plt.show()
copy

Stapeldiagrammet visar andelen varians som förklaras av varje huvudkomponent. Värmekartan visar laddningarna, som indikerar hur mycket varje ursprunglig variabel bidrar till varje huvudkomponent. Stora absoluta värden innebär att en variabel är viktig för den komponenten.

question mark

Vad indikerar ett stort absolutvärde i en komponentladdningsmatris om en variabels relation till en huvudkomponent i PCA

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 3. Kapitel 2

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Awesome!

Completion rate improved to 8.33

bookVisualisering av Förklarad Varians och Komponentladdningar

Svep för att visa menyn

Efter att ha anpassat PCA är det viktigt att förstå hur mycket information (varians) varje huvudkomponent fångar. Förklarad varianskvot visar detta. Du kan även granska komponentladdningarna för att se hur ursprungliga variabler bidrar till varje huvudkomponent.

1234567891011121314151617181920212223242526272829303132333435
import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.preprocessing import StandardScaler from sklearn.decomposition import PCA import matplotlib.pyplot as plt import seaborn as sns # Load the Iris dataset data = load_iris() X = data.data feature_names = data.feature_names # Standardize features (important for PCA) scaler = StandardScaler() X_scaled = scaler.fit_transform(X) # Apply PCA to reduce to 2 components pca = PCA(n_components=2) X_pca = pca.fit_transform(X_scaled) # Plot explained variance ratio plt.figure(figsize=(6,4)) plt.bar(range(1, len(pca.explained_variance_ratio_)+1), pca.explained_variance_ratio_, alpha=0.7) plt.ylabel('Explained Variance Ratio') plt.xlabel('Principal Component') plt.title('Explained Variance by Principal Components') plt.show() # Display component loadings as a heatmap loadings = pd.DataFrame(pca.components_.T, columns=['PC1', 'PC2'], index=feature_names) plt.figure(figsize=(6,4)) sns.heatmap(loadings, annot=True, cmap='coolwarm') plt.title('Principal Component Loadings') plt.show()
copy

Stapeldiagrammet visar andelen varians som förklaras av varje huvudkomponent. Värmekartan visar laddningarna, som indikerar hur mycket varje ursprunglig variabel bidrar till varje huvudkomponent. Stora absoluta värden innebär att en variabel är viktig för den komponenten.

question mark

Vad indikerar ett stort absolutvärde i en komponentladdningsmatris om en variabels relation till en huvudkomponent i PCA

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 3. Kapitel 2
some-alt