Visualisering av Förklarad Varians och Komponentladdningar
Efter att ha anpassat PCA är det viktigt att förstå hur mycket information (varians) varje huvudkomponent fångar. Förklarad varianskvot visar detta. Du kan även granska komponentladdningarna för att se hur ursprungliga variabler bidrar till varje huvudkomponent.
1234567891011121314151617181920212223242526272829303132333435import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.preprocessing import StandardScaler from sklearn.decomposition import PCA import matplotlib.pyplot as plt import seaborn as sns # Load the Iris dataset data = load_iris() X = data.data feature_names = data.feature_names # Standardize features (important for PCA) scaler = StandardScaler() X_scaled = scaler.fit_transform(X) # Apply PCA to reduce to 2 components pca = PCA(n_components=2) X_pca = pca.fit_transform(X_scaled) # Plot explained variance ratio plt.figure(figsize=(6,4)) plt.bar(range(1, len(pca.explained_variance_ratio_)+1), pca.explained_variance_ratio_, alpha=0.7) plt.ylabel('Explained Variance Ratio') plt.xlabel('Principal Component') plt.title('Explained Variance by Principal Components') plt.show() # Display component loadings as a heatmap loadings = pd.DataFrame(pca.components_.T, columns=['PC1', 'PC2'], index=feature_names) plt.figure(figsize=(6,4)) sns.heatmap(loadings, annot=True, cmap='coolwarm') plt.title('Principal Component Loadings') plt.show()
Stapeldiagrammet visar andelen varians som förklaras av varje huvudkomponent. Värmekartan visar laddningarna, som indikerar hur mycket varje ursprunglig variabel bidrar till varje huvudkomponent. Stora absoluta värden innebär att en variabel är viktig för den komponenten.
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 8.33
Visualisering av Förklarad Varians och Komponentladdningar
Svep för att visa menyn
Efter att ha anpassat PCA är det viktigt att förstå hur mycket information (varians) varje huvudkomponent fångar. Förklarad varianskvot visar detta. Du kan även granska komponentladdningarna för att se hur ursprungliga variabler bidrar till varje huvudkomponent.
1234567891011121314151617181920212223242526272829303132333435import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.preprocessing import StandardScaler from sklearn.decomposition import PCA import matplotlib.pyplot as plt import seaborn as sns # Load the Iris dataset data = load_iris() X = data.data feature_names = data.feature_names # Standardize features (important for PCA) scaler = StandardScaler() X_scaled = scaler.fit_transform(X) # Apply PCA to reduce to 2 components pca = PCA(n_components=2) X_pca = pca.fit_transform(X_scaled) # Plot explained variance ratio plt.figure(figsize=(6,4)) plt.bar(range(1, len(pca.explained_variance_ratio_)+1), pca.explained_variance_ratio_, alpha=0.7) plt.ylabel('Explained Variance Ratio') plt.xlabel('Principal Component') plt.title('Explained Variance by Principal Components') plt.show() # Display component loadings as a heatmap loadings = pd.DataFrame(pca.components_.T, columns=['PC1', 'PC2'], index=feature_names) plt.figure(figsize=(6,4)) sns.heatmap(loadings, annot=True, cmap='coolwarm') plt.title('Principal Component Loadings') plt.show()
Stapeldiagrammet visar andelen varians som förklaras av varje huvudkomponent. Värmekartan visar laddningarna, som indikerar hur mycket varje ursprunglig variabel bidrar till varje huvudkomponent. Stora absoluta värden innebär att en variabel är viktig för den komponenten.
Tack för dina kommentarer!