Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Toteutus Esimerkkiaineistolla | Hierarkkinen Klusterointi
Klusterianalyysi

bookToteutus Esimerkkiaineistolla

Kuten tavallista, käytät seuraavia kirjastoja:

  • sklearn keinotekoisen datan luomiseen ja hierarkkisen klusteroinnin toteuttamiseen (AgglomerativeClustering);

  • scipy dendrogrammin luomiseen ja käsittelyyn;

  • matplotlib klustereiden ja dendrogrammin visualisointiin;

  • numpy numeerisiin operaatioihin.

Keinotekoisen datan luominen

Voit käyttää make_blobs()-kirjaston scikit-learn-funktiota luodaksesi aineistoja, joissa on eri määrä klustereita ja vaihtelevia erottelutasoja. Tämä auttaa havainnoimaan, miten hierarkkinen klusterointi toimii erilaisissa tilanteissa.

Yleinen algoritmi etenee seuraavasti:

  1. Luot AgglomerativeClustering-olion määrittelemällä linkage-menetelmän ja muut parametrit;

  2. Sovitat mallin dataan;

  3. Voit poimia klusteritunnisteet, jos päätät käyttää tiettyä klusterimäärää;

  4. Visualisoit klusterit (jos data on 2D- tai 3D-muodossa) käyttäen hajontakuvioita;

  5. Käytät SciPyn linkage-funktiota luodaksesi linkage-matriisin ja sitten dendrogram-funktiota dendrogrammin visualisoimiseksi.

Voit myös kokeilla eri linkage-menetelmiä (esim. single, complete, average, Ward's) ja tarkastella, miten ne vaikuttavat klusteroinnin tuloksiin ja dendrogrammin rakenteeseen.

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 3

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 2.94

bookToteutus Esimerkkiaineistolla

Pyyhkäise näyttääksesi valikon

Kuten tavallista, käytät seuraavia kirjastoja:

  • sklearn keinotekoisen datan luomiseen ja hierarkkisen klusteroinnin toteuttamiseen (AgglomerativeClustering);

  • scipy dendrogrammin luomiseen ja käsittelyyn;

  • matplotlib klustereiden ja dendrogrammin visualisointiin;

  • numpy numeerisiin operaatioihin.

Keinotekoisen datan luominen

Voit käyttää make_blobs()-kirjaston scikit-learn-funktiota luodaksesi aineistoja, joissa on eri määrä klustereita ja vaihtelevia erottelutasoja. Tämä auttaa havainnoimaan, miten hierarkkinen klusterointi toimii erilaisissa tilanteissa.

Yleinen algoritmi etenee seuraavasti:

  1. Luot AgglomerativeClustering-olion määrittelemällä linkage-menetelmän ja muut parametrit;

  2. Sovitat mallin dataan;

  3. Voit poimia klusteritunnisteet, jos päätät käyttää tiettyä klusterimäärää;

  4. Visualisoit klusterit (jos data on 2D- tai 3D-muodossa) käyttäen hajontakuvioita;

  5. Käytät SciPyn linkage-funktiota luodaksesi linkage-matriisin ja sitten dendrogram-funktiota dendrogrammin visualisoimiseksi.

Voit myös kokeilla eri linkage-menetelmiä (esim. single, complete, average, Ward's) ja tarkastella, miten ne vaikuttavat klusteroinnin tuloksiin ja dendrogrammin rakenteeseen.

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 3
some-alt