Toteutus Esimerkkiaineistolla
Kuten tavallista, käytössä ovat seuraavat kirjastot:
-
sklearnkeinotekoisen datan luomiseen ja hierarkkisen klusteroinnin toteuttamiseen (AgglomerativeClustering); -
scipydendrogrammin luomiseen ja käsittelyyn; -
matplotlibklustereiden ja dendrogrammin visualisointiin; -
numpynumeerisiin operaatioihin.
Keinotekoisen datan luominen
make_blobs()-kirjaston scikit-learn-funktiolla voidaan luoda aineistoja, joissa on eri määrä klustereita ja vaihtelevia erottelutasoja. Tämä auttaa havainnoimaan, miten hierarkkinen klusterointi toimii erilaisissa tilanteissa.
Yleinen algoritmi etenee seuraavasti:
-
AgglomerativeClustering-olion luonti, jossa määritellään linkage-menetelmä ja muut parametrit; -
Mallin sovitus dataan;
-
Klusteritunnisteiden poiminta, jos klustereiden määrä on päätetty;
-
Klustereiden visualisointi (jos data on 2D- tai 3D-muodossa) hajontakuvioiden avulla;
-
SciPy:n
linkage-toiminnolla linkage-matriisin luonti ja tämän jälkeen dendrogrammin visualisointi.
Voit myös kokeilla eri linkage-menetelmiä (esim. single, complete, average, Ward's) ja tarkastella, miten ne vaikuttavat klusterointituloksiin ja dendrogrammin rakenteeseen.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain the difference between the various linkage methods?
How do I interpret a dendrogram in hierarchical clustering?
What are some practical tips for choosing the number of clusters?
Awesome!
Completion rate improved to 2.94
Toteutus Esimerkkiaineistolla
Pyyhkäise näyttääksesi valikon
Kuten tavallista, käytössä ovat seuraavat kirjastot:
-
sklearnkeinotekoisen datan luomiseen ja hierarkkisen klusteroinnin toteuttamiseen (AgglomerativeClustering); -
scipydendrogrammin luomiseen ja käsittelyyn; -
matplotlibklustereiden ja dendrogrammin visualisointiin; -
numpynumeerisiin operaatioihin.
Keinotekoisen datan luominen
make_blobs()-kirjaston scikit-learn-funktiolla voidaan luoda aineistoja, joissa on eri määrä klustereita ja vaihtelevia erottelutasoja. Tämä auttaa havainnoimaan, miten hierarkkinen klusterointi toimii erilaisissa tilanteissa.
Yleinen algoritmi etenee seuraavasti:
-
AgglomerativeClustering-olion luonti, jossa määritellään linkage-menetelmä ja muut parametrit; -
Mallin sovitus dataan;
-
Klusteritunnisteiden poiminta, jos klustereiden määrä on päätetty;
-
Klustereiden visualisointi (jos data on 2D- tai 3D-muodossa) hajontakuvioiden avulla;
-
SciPy:n
linkage-toiminnolla linkage-matriisin luonti ja tämän jälkeen dendrogrammin visualisointi.
Voit myös kokeilla eri linkage-menetelmiä (esim. single, complete, average, Ward's) ja tarkastella, miten ne vaikuttavat klusterointituloksiin ja dendrogrammin rakenteeseen.
Kiitos palautteestasi!