Implementierung mit Realem Datensatz
Sie verwenden den Mall-Kunden-Datensatz, der die folgenden Spalten enthält:
Folgende Schritte sollten vor der Clusterbildung durchgeführt werden:
- Daten laden: Mit
pandas
wird die CSV-Datei geladen; - Relevante Merkmale auswählen: Es wird auf die Spalten
'Annual Income (k$)'
und'Spending Score (1-100)'
fokussiert; - Datenskalierung (wichtig für DBSCAN): Da DBSCAN Distanzberechnungen verwendet, ist es entscheidend, die Merkmale auf ähnliche Wertebereiche zu skalieren. Hierfür kann
StandardScaler
verwendet werden.
Interpretation
Der Code erstellt in diesem Fall 5 Cluster. Es ist wichtig, die resultierenden Cluster zu analysieren, um Erkenntnisse zur Kundensegmentierung zu gewinnen. Beispielsweise könnten Cluster folgende Gruppen repräsentieren:
-
Kunden mit hohem Einkommen und hohem Ausgabeverhalten;
-
Kunden mit hohem Einkommen und geringem Ausgabeverhalten;
-
Kunden mit geringem Einkommen und hohem Ausgabeverhalten;
-
Kunden mit geringem Einkommen und geringem Ausgabeverhalten;
-
Kunden mit mittlerem Einkommen und mittlerem Ausgabeverhalten.
Abschließende Bemerkungen
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 2.94
Implementierung mit Realem Datensatz
Swipe um das Menü anzuzeigen
Sie verwenden den Mall-Kunden-Datensatz, der die folgenden Spalten enthält:
Folgende Schritte sollten vor der Clusterbildung durchgeführt werden:
- Daten laden: Mit
pandas
wird die CSV-Datei geladen; - Relevante Merkmale auswählen: Es wird auf die Spalten
'Annual Income (k$)'
und'Spending Score (1-100)'
fokussiert; - Datenskalierung (wichtig für DBSCAN): Da DBSCAN Distanzberechnungen verwendet, ist es entscheidend, die Merkmale auf ähnliche Wertebereiche zu skalieren. Hierfür kann
StandardScaler
verwendet werden.
Interpretation
Der Code erstellt in diesem Fall 5 Cluster. Es ist wichtig, die resultierenden Cluster zu analysieren, um Erkenntnisse zur Kundensegmentierung zu gewinnen. Beispielsweise könnten Cluster folgende Gruppen repräsentieren:
-
Kunden mit hohem Einkommen und hohem Ausgabeverhalten;
-
Kunden mit hohem Einkommen und geringem Ausgabeverhalten;
-
Kunden mit geringem Einkommen und hohem Ausgabeverhalten;
-
Kunden mit geringem Einkommen und geringem Ausgabeverhalten;
-
Kunden mit mittlerem Einkommen und mittlerem Ausgabeverhalten.
Abschließende Bemerkungen
Danke für Ihr Feedback!