Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Implementering på Dummy-Dataset | Dbscan
Klusteranalys

bookImplementering på Dummy-Dataset

Du kommer att skapa två dataset för att demonstrera DBSCAN:s styrkor:

  • Moons: två sammanflätade halvcirklar;

  • Circles: en liten cirkel inuti en större cirkel.

Algoritmen är följande:

  1. Du instansierar DBSCAN-objektet och anger eps och min_samples;

  2. Du anpassar modellen till dina data;

  3. Du visualiserar resultaten genom att plotta datapunkterna och färglägga dem enligt deras tilldelade klusteretiketter.

Justering av hyperparametrar

Valet av eps och min_samples påverkar klustringsresultatet avsevärt. Experimentera med olika värden för att hitta det som fungerar bäst för dina data. Om till exempel eps är för stort kan alla punkter hamna i ett enda kluster. Om eps är för litet kan många punkter klassificeras som brus. Du kan även skala funktionerna.

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 5. Kapitel 4

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Suggested prompts:

What is the intuition behind why DBSCAN works better than K-means for these shapes?

How do I choose the best values for epsilon and min_samples in DBSCAN?

Can you explain the difference between core points and border points in DBSCAN?

Awesome!

Completion rate improved to 2.94

bookImplementering på Dummy-Dataset

Svep för att visa menyn

Du kommer att skapa två dataset för att demonstrera DBSCAN:s styrkor:

  • Moons: två sammanflätade halvcirklar;

  • Circles: en liten cirkel inuti en större cirkel.

Algoritmen är följande:

  1. Du instansierar DBSCAN-objektet och anger eps och min_samples;

  2. Du anpassar modellen till dina data;

  3. Du visualiserar resultaten genom att plotta datapunkterna och färglägga dem enligt deras tilldelade klusteretiketter.

Justering av hyperparametrar

Valet av eps och min_samples påverkar klustringsresultatet avsevärt. Experimentera med olika värden för att hitta det som fungerar bäst för dina data. Om till exempel eps är för stort kan alla punkter hamna i ett enda kluster. Om eps är för litet kan många punkter klassificeras som brus. Du kan även skala funktionerna.

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 5. Kapitel 4
some-alt