Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Toteutus Esimerkkiaineistolla | Hierarkkinen Klusterointi
Klusterianalyysi Pythonilla

Toteutus Esimerkkiaineistolla

Pyyhkäise näyttääksesi valikon

Kuten tavallista, käytössä ovat seuraavat kirjastot:

  • sklearn keinotekoisen datan luomiseen ja hierarkkisen klusteroinnin toteuttamiseen (AgglomerativeClustering);

  • scipy dendrogrammin luomiseen ja käsittelyyn;

  • matplotlib klustereiden ja dendrogrammin visualisointiin;

  • numpy numeerisiin operaatioihin.

Keinotekoisen datan luominen

make_blobs()-kirjaston scikit-learn-funktiolla voidaan luoda aineistoja, joissa on eri määrä klustereita ja vaihtelevia erottelutasoja. Näin voidaan havainnoida, miten hierarkkinen klusterointi toimii erilaisissa tilanteissa.

Keinotekoinen data

Yleinen algoritmi etenee seuraavasti:

  1. AgglomerativeClustering-olion luonti, jossa määritetään linkage-menetelmä ja muut parametrit;

  2. Mallin sovittaminen dataan;

  3. Klusteritunnisteiden poiminta, jos klustereiden määrä on päätetty;

  4. Klustereiden visualisointi (jos data on 2D- tai 3D-muodossa) käyttäen hajontakuvioita;

  5. SciPyn linkage-funktion käyttö linkage-matriisin luomiseen ja sen jälkeen dendrogram-funktion käyttö dendrogrammin visualisointiin.

Voit myös kokeilla eri linkage-menetelmiä (esim. single, complete, average, Ward's) ja tarkastella, miten ne vaikuttavat klusteroinnin tuloksiin ja dendrogrammin rakenteeseen.

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 3

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Osio 4. Luku 3
some-alt