Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Optimalt Antal Kluster | Hierarkisk Klustring
Klusteranalys

bookOptimalt Antal Kluster

Till skillnad från K-means ger hierarkisk klustring inte direkt ett fast antal kluster. Istället skapas en hierarki. Du behöver en metod för att avgöra var du ska dela dendrogrammet för att erhålla önskat antal kluster.

Metoder för att bestämma antal kluster

För att avgöra det optimala antalet kluster används flera vanliga metoder, inklusive dendrogramvisualisering, armbågemetoden och silhuettmetoden.

Dendrogramvisualisering

Denna metod innebär att man visuellt inspekterar dendrogrammet för de största vertikala gapen som inte korsas av horisontella linjer. Antalet kluster kan härledas från antalet vertikala linjer som dessa gap omfattar. Dock är denna metod subjektiv och bygger mycket på visuell tolkning.

Armbågemetoden (med within-cluster sum of squares - WCSS)

I denna metod utförs hierarkisk klustring för ett intervall av klusterantal och WCSS beräknas för varje. Genom att plotta WCSS-värden mot antal kluster kan du identifiera en "armbåge" i diagrammet. Denna punkt indikerar en bra balans mellan att minimera WCSS och att undvika ett överdrivet antal kluster, liknande armbågemetoden i K-means.

Silhuettmetoden

Denna metod innebär att man beräknar silhuettvärden för olika antal kluster genom att dela dendrogrammet på olika höjder. Det optimala antalet kluster är det som motsvarar det högsta genomsnittliga silhuettvärdet.

Note
Notering

Att beräkna WCSS och silhuettvärden för hierarkisk klustring kan vara beräkningsmässigt krävande, särskilt för stora datamängder.

Vid val av antal kluster bör även din förståelse för datan och det problem du försöker lösa vägleda ditt val.

question mark

Vilken av följande metoder används ofta för att bestämma antalet kluster vid hierarkisk klustring?

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 4. Kapitel 2

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Awesome!

Completion rate improved to 2.94

bookOptimalt Antal Kluster

Svep för att visa menyn

Till skillnad från K-means ger hierarkisk klustring inte direkt ett fast antal kluster. Istället skapas en hierarki. Du behöver en metod för att avgöra var du ska dela dendrogrammet för att erhålla önskat antal kluster.

Metoder för att bestämma antal kluster

För att avgöra det optimala antalet kluster används flera vanliga metoder, inklusive dendrogramvisualisering, armbågemetoden och silhuettmetoden.

Dendrogramvisualisering

Denna metod innebär att man visuellt inspekterar dendrogrammet för de största vertikala gapen som inte korsas av horisontella linjer. Antalet kluster kan härledas från antalet vertikala linjer som dessa gap omfattar. Dock är denna metod subjektiv och bygger mycket på visuell tolkning.

Armbågemetoden (med within-cluster sum of squares - WCSS)

I denna metod utförs hierarkisk klustring för ett intervall av klusterantal och WCSS beräknas för varje. Genom att plotta WCSS-värden mot antal kluster kan du identifiera en "armbåge" i diagrammet. Denna punkt indikerar en bra balans mellan att minimera WCSS och att undvika ett överdrivet antal kluster, liknande armbågemetoden i K-means.

Silhuettmetoden

Denna metod innebär att man beräknar silhuettvärden för olika antal kluster genom att dela dendrogrammet på olika höjder. Det optimala antalet kluster är det som motsvarar det högsta genomsnittliga silhuettvärdet.

Note
Notering

Att beräkna WCSS och silhuettvärden för hierarkisk klustring kan vara beräkningsmässigt krävande, särskilt för stora datamängder.

Vid val av antal kluster bör även din förståelse för datan och det problem du försöker lösa vägleda ditt val.

question mark

Vilken av följande metoder används ofta för att bestämma antalet kluster vid hierarkisk klustring?

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 4. Kapitel 2
some-alt