Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Toteutus Esimerkkiaineistolla | Osio
Ohjaamattoman Oppimisen Perusteet

bookToteutus Esimerkkiaineistolla

Kuten tavallista, käytät seuraavia kirjastoja:

  • sklearn keinotekoisen datan luomiseen ja hierarkkisen klusteroinnin toteuttamiseen (AgglomerativeClustering);

  • scipy dendrogrammin luomiseen ja käsittelyyn;

  • matplotlib klustereiden ja dendrogrammin visualisointiin;

  • numpy numeerisiin operaatioihin.

Keinotekoisen datan luominen

Voit käyttää make_blobs()-kirjaston scikit-learn-funktiota luodaksesi aineistoja, joissa on eri määrä klustereita ja vaihtelevia erottuvuuksia. Tämä auttaa havainnoimaan, miten hierarkkinen klusterointi toimii erilaisissa tilanteissa.

Yleinen algoritmi etenee seuraavasti:

  1. Instanssoit AgglomerativeClustering-olion ja määrittelet linkitysmenetelmän sekä muut parametrit;

  2. Sovitat mallin dataasi;

  3. Voit poimia klusteritunnisteet, jos päätät tietyn klustereiden määrän;

  4. Visualisoit klusterit (jos data on 2D- tai 3D-muodossa) käyttäen hajontakuvioita;

  5. Käytät SciPyn linkage-funktiota luodaksesi linkitysmatriisin ja sitten dendrogram-funktiota dendrogrammin visualisointiin.

Voit myös kokeilla eri linkitysmenetelmiä (esim. single, complete, average, Ward's) ja tarkastella, miten ne vaikuttavat klusterointituloksiin ja dendrogrammin rakenteeseen.

question mark

Mitä scikit-learn-luokkaa käytetään hierarkkisen klusteroinnin suorittamiseen dummy-aineistolla?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 16

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

bookToteutus Esimerkkiaineistolla

Pyyhkäise näyttääksesi valikon

Kuten tavallista, käytät seuraavia kirjastoja:

  • sklearn keinotekoisen datan luomiseen ja hierarkkisen klusteroinnin toteuttamiseen (AgglomerativeClustering);

  • scipy dendrogrammin luomiseen ja käsittelyyn;

  • matplotlib klustereiden ja dendrogrammin visualisointiin;

  • numpy numeerisiin operaatioihin.

Keinotekoisen datan luominen

Voit käyttää make_blobs()-kirjaston scikit-learn-funktiota luodaksesi aineistoja, joissa on eri määrä klustereita ja vaihtelevia erottuvuuksia. Tämä auttaa havainnoimaan, miten hierarkkinen klusterointi toimii erilaisissa tilanteissa.

Yleinen algoritmi etenee seuraavasti:

  1. Instanssoit AgglomerativeClustering-olion ja määrittelet linkitysmenetelmän sekä muut parametrit;

  2. Sovitat mallin dataasi;

  3. Voit poimia klusteritunnisteet, jos päätät tietyn klustereiden määrän;

  4. Visualisoit klusterit (jos data on 2D- tai 3D-muodossa) käyttäen hajontakuvioita;

  5. Käytät SciPyn linkage-funktiota luodaksesi linkitysmatriisin ja sitten dendrogram-funktiota dendrogrammin visualisointiin.

Voit myös kokeilla eri linkitysmenetelmiä (esim. single, complete, average, Ward's) ja tarkastella, miten ne vaikuttavat klusterointituloksiin ja dendrogrammin rakenteeseen.

question mark

Mitä scikit-learn-luokkaa käytetään hierarkkisen klusteroinnin suorittamiseen dummy-aineistolla?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 16
some-alt