Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Optimalt Antal Kluster | Sektion
Grunderna i osupervised learning

bookOptimalt Antal Kluster

Till skillnad från K-means ger hierarkisk klustring inte direkt ett fast antal kluster. Istället producerar den en hierarki. Du behöver en metod för att avgöra var du ska dela dendrogrammet för att erhålla önskat antal kluster.

Metoder för att bestämma antalet kluster

För att bestämma det optimala antalet kluster används flera vanliga metoder, inklusive dendrogramvisualisering, armbågmetoden och silhuettmetoden.

Dendrogramvisualisering

Denna metod innebär att man visuellt inspekterar dendrogrammet för de största vertikala gapen som inte korsas av horisontella linjer. Antalet kluster kan härledas från antalet vertikala linjer som dessa gap omfattar. Dock är denna metod subjektiv och är starkt beroende av visuell tolkning.

Armbågmetoden (med within-cluster sum of squares - WCSS)

I denna metod utförs hierarkisk klustring för ett intervall av klusterantal och WCSS beräknas för varje. Genom att plotta WCSS-värden mot antalet kluster kan du identifiera en "armbågspunkt" i diagrammet. Denna punkt indikerar en bra balans mellan att minimera WCSS och att undvika ett överdrivet antal kluster, liknande armbågmetoden i K-means.

Silhuettmetoden

Denna metod innebär att silhuettvärden beräknas för olika antal kluster genom att dela dendrogrammet vid olika höjder. Det optimala antalet kluster är det som motsvarar det högsta genomsnittliga silhuettvärdet.

Note
Notering

Att beräkna WCSS och silhuettvärden för hierarkisk klustring kan vara beräkningsmässigt kostsamt, särskilt för stora datamängder.

Vid val av antal kluster bör även din förståelse för datan och det problem du försöker lösa vägleda ditt val.

question mark

Vilken av följande är en vanligt använd metod för att bestämma antalet kluster vid hierarkisk klustring?

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 15

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

bookOptimalt Antal Kluster

Svep för att visa menyn

Till skillnad från K-means ger hierarkisk klustring inte direkt ett fast antal kluster. Istället producerar den en hierarki. Du behöver en metod för att avgöra var du ska dela dendrogrammet för att erhålla önskat antal kluster.

Metoder för att bestämma antalet kluster

För att bestämma det optimala antalet kluster används flera vanliga metoder, inklusive dendrogramvisualisering, armbågmetoden och silhuettmetoden.

Dendrogramvisualisering

Denna metod innebär att man visuellt inspekterar dendrogrammet för de största vertikala gapen som inte korsas av horisontella linjer. Antalet kluster kan härledas från antalet vertikala linjer som dessa gap omfattar. Dock är denna metod subjektiv och är starkt beroende av visuell tolkning.

Armbågmetoden (med within-cluster sum of squares - WCSS)

I denna metod utförs hierarkisk klustring för ett intervall av klusterantal och WCSS beräknas för varje. Genom att plotta WCSS-värden mot antalet kluster kan du identifiera en "armbågspunkt" i diagrammet. Denna punkt indikerar en bra balans mellan att minimera WCSS och att undvika ett överdrivet antal kluster, liknande armbågmetoden i K-means.

Silhuettmetoden

Denna metod innebär att silhuettvärden beräknas för olika antal kluster genom att dela dendrogrammet vid olika höjder. Det optimala antalet kluster är det som motsvarar det högsta genomsnittliga silhuettvärdet.

Note
Notering

Att beräkna WCSS och silhuettvärden för hierarkisk klustring kan vara beräkningsmässigt kostsamt, särskilt för stora datamängder.

Vid val av antal kluster bör även din förståelse för datan och det problem du försöker lösa vägleda ditt val.

question mark

Vilken av följande är en vanligt använd metod för att bestämma antalet kluster vid hierarkisk klustring?

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 15
some-alt