Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Implementierung auf Dummy-Datensatz | Abschnitt
Practice
Projects
Quizzes & Challenges
Quizze
Challenges
/
Grundlagen des Unüberwachten Lernens

bookImplementierung auf Dummy-Datensatz

Wie üblich verwenden Sie die folgenden Bibliotheken:

  • sklearn zum Generieren von Dummy-Daten und zur Implementierung des hierarchischen Clusterings (AgglomerativeClustering);
  • scipy zum Erzeugen und Arbeiten mit dem Dendrogramm;
  • matplotlib zur Visualisierung der Cluster und des Dendrogramms;
  • numpy für numerische Operationen.

Generierung von Dummy-Daten

Mit der Funktion make_blobs() aus scikit-learn lassen sich Datensätze mit unterschiedlicher Clusteranzahl und variierenden Trennschärfen erzeugen. Dies ermöglicht es, die Leistungsfähigkeit des hierarchischen Clusterings in verschiedenen Szenarien zu beobachten.

Der allgemeine Algorithmus ist wie folgt:

  1. Instanziierung des AgglomerativeClustering-Objekts unter Angabe der Linkage-Methode und weiterer Parameter;
  2. Anpassung des Modells an die Daten;
  3. Extraktion der Cluster-Labels, sofern eine bestimmte Clusteranzahl festgelegt wird;
  4. Visualisierung der Cluster (bei 2D- oder 3D-Daten) mittels Streudiagrammen;
  5. Verwendung von SciPys linkage zur Erstellung der Linkage-Matrix und anschließend dendrogram zur Visualisierung des Dendrogramms.

Es empfiehlt sich, mit verschiedenen Linkage-Methoden (z. B. single, complete, average, Ward’s) zu experimentieren und deren Einfluss auf die Clustering-Ergebnisse sowie die Struktur des Dendrogramms zu beobachten.

question mark

Welche Klasse aus scikit-learn wird verwendet, um hierarchisches Clustering auf einem Dummy-Datensatz durchzuführen?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 16

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

bookImplementierung auf Dummy-Datensatz

Swipe um das Menü anzuzeigen

Wie üblich verwenden Sie die folgenden Bibliotheken:

  • sklearn zum Generieren von Dummy-Daten und zur Implementierung des hierarchischen Clusterings (AgglomerativeClustering);
  • scipy zum Erzeugen und Arbeiten mit dem Dendrogramm;
  • matplotlib zur Visualisierung der Cluster und des Dendrogramms;
  • numpy für numerische Operationen.

Generierung von Dummy-Daten

Mit der Funktion make_blobs() aus scikit-learn lassen sich Datensätze mit unterschiedlicher Clusteranzahl und variierenden Trennschärfen erzeugen. Dies ermöglicht es, die Leistungsfähigkeit des hierarchischen Clusterings in verschiedenen Szenarien zu beobachten.

Der allgemeine Algorithmus ist wie folgt:

  1. Instanziierung des AgglomerativeClustering-Objekts unter Angabe der Linkage-Methode und weiterer Parameter;
  2. Anpassung des Modells an die Daten;
  3. Extraktion der Cluster-Labels, sofern eine bestimmte Clusteranzahl festgelegt wird;
  4. Visualisierung der Cluster (bei 2D- oder 3D-Daten) mittels Streudiagrammen;
  5. Verwendung von SciPys linkage zur Erstellung der Linkage-Matrix und anschließend dendrogram zur Visualisierung des Dendrogramms.

Es empfiehlt sich, mit verschiedenen Linkage-Methoden (z. B. single, complete, average, Ward’s) zu experimentieren und deren Einfluss auf die Clustering-Ergebnisse sowie die Struktur des Dendrogramms zu beobachten.

question mark

Welche Klasse aus scikit-learn wird verwendet, um hierarchisches Clustering auf einem Dummy-Datensatz durchzuführen?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 16
some-alt