Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Toteutus Esimerkkiaineistolla | DBSCAN
Klusterianalyysi

bookToteutus Esimerkkiaineistolla

Luot kaksi datasarjaa havainnollistaaksesi DBSCAN:n vahvuuksia:

  • Moons: kaksi lomittuvaa puolikuuta;
  • Circles: pieni ympyrä suuremman ympyrän sisällä.

Algoritmi etenee seuraavasti:

  1. Instansioit DBSCAN-olion ja asetat eps- ja min_samples-parametrit;

  2. Sovitat mallin dataasi;

  3. Visualisoit tulokset piirtämällä datapisteet ja värittämällä ne niiden klusteritunnisteiden mukaan.

Hyperparametrien säätäminen

eps- ja min_samples-arvojen valinta vaikuttaa merkittävästi klusteroinnin lopputulokseen. Kokeile eri arvoja löytääksesi parhaiten dataasi sopivat asetukset. Esimerkiksi, jos eps on liian suuri, kaikki pisteet voivat päätyä yhteen klusteriin. Jos eps on liian pieni, monet pisteet voidaan luokitella kohinaksi. Voit myös skaalata piirteitä.

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 5. Luku 4

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain how DBSCAN determines core points and border points?

What are some practical tips for choosing the right values for epsilon and min_samples?

How does DBSCAN compare to K-means for these types of datasets?

Awesome!

Completion rate improved to 2.94

bookToteutus Esimerkkiaineistolla

Pyyhkäise näyttääksesi valikon

Luot kaksi datasarjaa havainnollistaaksesi DBSCAN:n vahvuuksia:

  • Moons: kaksi lomittuvaa puolikuuta;
  • Circles: pieni ympyrä suuremman ympyrän sisällä.

Algoritmi etenee seuraavasti:

  1. Instansioit DBSCAN-olion ja asetat eps- ja min_samples-parametrit;

  2. Sovitat mallin dataasi;

  3. Visualisoit tulokset piirtämällä datapisteet ja värittämällä ne niiden klusteritunnisteiden mukaan.

Hyperparametrien säätäminen

eps- ja min_samples-arvojen valinta vaikuttaa merkittävästi klusteroinnin lopputulokseen. Kokeile eri arvoja löytääksesi parhaiten dataasi sopivat asetukset. Esimerkiksi, jos eps on liian suuri, kaikki pisteet voivat päätyä yhteen klusteriin. Jos eps on liian pieni, monet pisteet voidaan luokitella kohinaksi. Voit myös skaalata piirteitä.

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 5. Luku 4
some-alt