Implementierung an Einem Realen Datensatz
Swipe um das Menü anzuzeigen
Verwendung des Mall-Kunden-Datensatzes, der die folgenden Spalten enthält:
Folgende Schritte sollten vor der Clusterbildung durchgeführt werden:
- Daten laden: Verwendung von
pandaszum Laden der CSV-Datei; - Relevante Merkmale auswählen: Fokussierung auf die Spalten
'Annual Income (k$)'und'Spending Score (1-100)'; - Datenskalierung (wichtig für DBSCAN): Da DBSCAN Distanzberechnungen verwendet, ist es entscheidend, die Merkmale auf ähnliche Wertebereiche zu skalieren. Hierfür kann
StandardScalerverwendet werden.
Interpretation
Der Code erstellt in diesem Fall 5 Cluster. Es ist wichtig, die resultierenden Cluster zu analysieren, um Erkenntnisse zur Kundensegmentierung zu gewinnen. Beispielsweise könnten Cluster folgende Gruppen repräsentieren:
- Kunden mit hohem Einkommen und hohem Ausgabeverhalten;
- Kunden mit hohem Einkommen und niedrigem Ausgabeverhalten;
- Kunden mit niedrigem Einkommen und hohem Ausgabeverhalten;
- Kunden mit niedrigem Einkommen und niedrigem Ausgabeverhalten;
- Kunden mit mittlerem Einkommen und mittlerem Ausgabeverhalten.
Abschließende Bemerkungen
War alles klar?
Danke für Ihr Feedback!
Abschnitt 5. Kapitel 5
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Großartig!
Completion Rate verbessert auf 2.94Abschnitt 5. Kapitel 5