Utføring av hierarkisk klynging
En clustermap er et matriseplott som kombinerer et heatmap med hierarkisk klynging.
Mens et vanlig heatmap viser data i et fast rutenett, omorganiserer en clustermap radene og kolonnene for å plassere lignende verdier ved siden av hverandre. De trelignende diagrammene på aksene kalles dendrogrammer, og de viser hvordan datapunktene er gruppert.
Viktige parametere
For å kontrollere hvordan klyngingen fungerer, kan du bruke disse parameterne:
standard_scale: standardiserer dataene (0 for rader, 1 for kolonner) slik at hver variabel har et gjennomsnitt på 0 og varians på 1. Dette er viktig når variablene har ulike enheter;metric: avstandsmålet som skal brukes (f.eks.'euclidean','correlation'). Dette avgjør hva som regnes som "lignende";method: koblingsalgoritmen som skal brukes (f.eks.'single','complete','average'). Dette avgjør hvordan klyngene grupperes.
Eksempel
Her er en clustermap av Iris-datasettet. Legg merke til hvordan artene (rader) automatisk grupperes sammen fordi de har lignende målinger.
12345678910111213141516171819import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('iris') # Prepare matrix (drop non-numeric column for calculation) species = df.pop("species") # Create a clustermap sns.clustermap( data=df, standard_scale=1, # Normalize columns metric='euclidean', # Measure distance method='average', # clustering method cmap='viridis', figsize=(6, 6) ) plt.show()
Swipe to start coding
Analyser flypassasjerdataene for å finne likheter mellom år.
- Sett stilen til
'ticks'. Endre bakgrunnsfargen til'seagreen'('figure.facecolor'). - Lag et clustermap ved å bruke den omformede
upd_dfDataFrame:
- Bruk
upd_dfsom data. - Normaliser kolonnene ved å sette
standard_scaletil1. - Bruk
'single'som klyngemetode (method). - Bruk
'correlation'som avstandsmål (metric). - Vis verdier i cellene (
annot=True). - Sett verdigrensene:
vmin=0ogvmax=10. - Bruk fargekartet
'vlag'.
- Vis plottet.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Fantastisk!
Completion rate forbedret til 4.55
Utføring av hierarkisk klynging
Sveip for å vise menyen
En clustermap er et matriseplott som kombinerer et heatmap med hierarkisk klynging.
Mens et vanlig heatmap viser data i et fast rutenett, omorganiserer en clustermap radene og kolonnene for å plassere lignende verdier ved siden av hverandre. De trelignende diagrammene på aksene kalles dendrogrammer, og de viser hvordan datapunktene er gruppert.
Viktige parametere
For å kontrollere hvordan klyngingen fungerer, kan du bruke disse parameterne:
standard_scale: standardiserer dataene (0 for rader, 1 for kolonner) slik at hver variabel har et gjennomsnitt på 0 og varians på 1. Dette er viktig når variablene har ulike enheter;metric: avstandsmålet som skal brukes (f.eks.'euclidean','correlation'). Dette avgjør hva som regnes som "lignende";method: koblingsalgoritmen som skal brukes (f.eks.'single','complete','average'). Dette avgjør hvordan klyngene grupperes.
Eksempel
Her er en clustermap av Iris-datasettet. Legg merke til hvordan artene (rader) automatisk grupperes sammen fordi de har lignende målinger.
12345678910111213141516171819import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('iris') # Prepare matrix (drop non-numeric column for calculation) species = df.pop("species") # Create a clustermap sns.clustermap( data=df, standard_scale=1, # Normalize columns metric='euclidean', # Measure distance method='average', # clustering method cmap='viridis', figsize=(6, 6) ) plt.show()
Swipe to start coding
Analyser flypassasjerdataene for å finne likheter mellom år.
- Sett stilen til
'ticks'. Endre bakgrunnsfargen til'seagreen'('figure.facecolor'). - Lag et clustermap ved å bruke den omformede
upd_dfDataFrame:
- Bruk
upd_dfsom data. - Normaliser kolonnene ved å sette
standard_scaletil1. - Bruk
'single'som klyngemetode (method). - Bruk
'correlation'som avstandsmål (metric). - Vis verdier i cellene (
annot=True). - Sett verdigrensene:
vmin=0ogvmax=10. - Bruk fargekartet
'vlag'.
- Vis plottet.
Løsning
Takk for tilbakemeldingene dine!
single