Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Implementierung auf Dummy-Datensatz | Abschnitt
Grundlagen des Unüberwachten Lernens

bookImplementierung auf Dummy-Datensatz

Es werden zwei Datensätze erstellt, um die Stärken von DBSCAN zu demonstrieren:

  • Moons: Zwei ineinandergreifende Halbkreise;
  • Circles: Ein kleiner Kreis innerhalb eines größeren Kreises.

Der Algorithmus verläuft wie folgt:

  1. Instanziierung des DBSCAN-Objekts mit Festlegung von eps und min_samples;
  2. Anpassung des Modells an die Daten;
  3. Visualisierung der Ergebnisse durch Plotten der Datenpunkte und farbliche Kennzeichnung entsprechend ihrer Cluster-Labels.

Abstimmung der Hyperparameter

Die Wahl von eps und min_samples beeinflusst das Clustering-Ergebnis maßgeblich. Verschiedene Werte sollten ausprobiert werden, um die optimale Einstellung für die eigenen Daten zu finden. Ist beispielsweise eps zu groß, können alle Punkte in einem einzigen Cluster landen. Ist eps zu klein, werden viele Punkte als Rauschen klassifiziert. Auch eine Skalierung der Merkmale ist möglich.

question mark

Welche Aussage beschreibt am besten die Auswirkung des Parameters eps beim DBSCAN-Clustering?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 22

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

bookImplementierung auf Dummy-Datensatz

Swipe um das Menü anzuzeigen

Es werden zwei Datensätze erstellt, um die Stärken von DBSCAN zu demonstrieren:

  • Moons: Zwei ineinandergreifende Halbkreise;
  • Circles: Ein kleiner Kreis innerhalb eines größeren Kreises.

Der Algorithmus verläuft wie folgt:

  1. Instanziierung des DBSCAN-Objekts mit Festlegung von eps und min_samples;
  2. Anpassung des Modells an die Daten;
  3. Visualisierung der Ergebnisse durch Plotten der Datenpunkte und farbliche Kennzeichnung entsprechend ihrer Cluster-Labels.

Abstimmung der Hyperparameter

Die Wahl von eps und min_samples beeinflusst das Clustering-Ergebnis maßgeblich. Verschiedene Werte sollten ausprobiert werden, um die optimale Einstellung für die eigenen Daten zu finden. Ist beispielsweise eps zu groß, können alle Punkte in einem einzigen Cluster landen. Ist eps zu klein, werden viele Punkte als Rauschen klassifiziert. Auch eine Skalierung der Merkmale ist möglich.

question mark

Welche Aussage beschreibt am besten die Auswirkung des Parameters eps beim DBSCAN-Clustering?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 22
some-alt