Utförande av Hierarkisk Klustring
En clustermap är en matrisgraf som kombinerar en värmekarta med hierarkisk klustring.
Medan en vanlig värmekarta visar data i ett fast rutnät, omordnar en clustermap rader och kolumner för att placera liknande värden intill varandra. De trädliknande diagrammen på axlarna kallas dendrogram och visar hur datapunkterna grupperas.
Viktiga parametrar
För att styra hur klustringen fungerar kan du använda dessa parametrar:
standard_scale: standardiserar data (0 för rader, 1 för kolumner) så att varje variabel har medelvärde 0 och varians 1. Detta är avgörande när variabler har olika enheter;metric: avståndsmåttet som används (t.ex.'euclidean','correlation'). Det avgör vad "liknande" betyder;method: länkage-algoritmen som används (t.ex.'single','complete','average'). Det avgör hur kluster grupperas.
Exempel
Här är en clustermap av Iris-datasetet. Notera hur arterna (raderna) automatiskt grupperas eftersom de har liknande mätvärden.
12345678910111213141516171819import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('iris') # Prepare matrix (drop non-numeric column for calculation) species = df.pop("species") # Create a clustermap sns.clustermap( data=df, standard_scale=1, # Normalize columns metric='euclidean', # Measure distance method='average', # clustering method cmap='viridis', figsize=(6, 6) ) plt.show()
Swipe to start coding
Analysera flygpassagerardata för att hitta likheter mellan år.
- Ställ in stilen på
'ticks'. Ändra bakgrundsfärgen till'seagreen'('figure.facecolor'). - Skapa en clustermap med den omformade
upd_dfDataFrame:
- Ange
upd_dfsom data. - Normalisera kolumnerna genom att sätta
standard_scaletill1. - Ställ in
'single'tillmethod. - Ställ in
'correlation'tillmetric. - Visa värden i cellerna (
annot=True). - Ange värdegränser:
vmin=0ochvmax=10. - Använd färgkartan
'vlag'.
- Visa diagrammet.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Fantastiskt!
Completion betyg förbättrat till 4.55
Utförande av Hierarkisk Klustring
Svep för att visa menyn
En clustermap är en matrisgraf som kombinerar en värmekarta med hierarkisk klustring.
Medan en vanlig värmekarta visar data i ett fast rutnät, omordnar en clustermap rader och kolumner för att placera liknande värden intill varandra. De trädliknande diagrammen på axlarna kallas dendrogram och visar hur datapunkterna grupperas.
Viktiga parametrar
För att styra hur klustringen fungerar kan du använda dessa parametrar:
standard_scale: standardiserar data (0 för rader, 1 för kolumner) så att varje variabel har medelvärde 0 och varians 1. Detta är avgörande när variabler har olika enheter;metric: avståndsmåttet som används (t.ex.'euclidean','correlation'). Det avgör vad "liknande" betyder;method: länkage-algoritmen som används (t.ex.'single','complete','average'). Det avgör hur kluster grupperas.
Exempel
Här är en clustermap av Iris-datasetet. Notera hur arterna (raderna) automatiskt grupperas eftersom de har liknande mätvärden.
12345678910111213141516171819import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('iris') # Prepare matrix (drop non-numeric column for calculation) species = df.pop("species") # Create a clustermap sns.clustermap( data=df, standard_scale=1, # Normalize columns metric='euclidean', # Measure distance method='average', # clustering method cmap='viridis', figsize=(6, 6) ) plt.show()
Swipe to start coding
Analysera flygpassagerardata för att hitta likheter mellan år.
- Ställ in stilen på
'ticks'. Ändra bakgrundsfärgen till'seagreen'('figure.facecolor'). - Skapa en clustermap med den omformade
upd_dfDataFrame:
- Ange
upd_dfsom data. - Normalisera kolumnerna genom att sätta
standard_scaletill1. - Ställ in
'single'tillmethod. - Ställ in
'correlation'tillmetric. - Visa värden i cellerna (
annot=True). - Ange värdegränser:
vmin=0ochvmax=10. - Använd färgkartan
'vlag'.
- Visa diagrammet.
Lösning
Tack för dina kommentarer!
single