Implementering på Verklig Datamängd
Du kommer att använda mall customers-datasetet, som innehåller följande kolumner:
Du bör också följa dessa steg innan klustring:
- Ladda in data: använd
pandas
för att ladda CSV-filen; - Välj relevanta variabler: fokusera på kolumnerna
'Annual Income (k$)'
och'Spending Score (1-100)'
; - Dataskalning (viktigt för DBSCAN): eftersom DBSCAN använder avståndsberäkningar är det avgörande att skala variablerna till liknande intervall. Använd
StandardScaler
för detta ändamål.
Tolkning
Koden skapar 5 kluster i detta fall. Det är viktigt att analysera de resulterande klustren för att få insikter om kundsegmentering. Till exempel kan du identifiera kluster som representerar:
-
Hög inkomst, hög konsumtion;
-
Hög inkomst, låg konsumtion;
-
Låg inkomst, hög konsumtion;
-
Låg inkomst, låg konsumtion;
-
Medellåg inkomst, medelhög konsumtion.
Avslutande anmärkningar
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 2.94
Implementering på Verklig Datamängd
Svep för att visa menyn
Du kommer att använda mall customers-datasetet, som innehåller följande kolumner:
Du bör också följa dessa steg innan klustring:
- Ladda in data: använd
pandas
för att ladda CSV-filen; - Välj relevanta variabler: fokusera på kolumnerna
'Annual Income (k$)'
och'Spending Score (1-100)'
; - Dataskalning (viktigt för DBSCAN): eftersom DBSCAN använder avståndsberäkningar är det avgörande att skala variablerna till liknande intervall. Använd
StandardScaler
för detta ändamål.
Tolkning
Koden skapar 5 kluster i detta fall. Det är viktigt att analysera de resulterande klustren för att få insikter om kundsegmentering. Till exempel kan du identifiera kluster som representerar:
-
Hög inkomst, hög konsumtion;
-
Hög inkomst, låg konsumtion;
-
Låg inkomst, hög konsumtion;
-
Låg inkomst, låg konsumtion;
-
Medellåg inkomst, medelhög konsumtion.
Avslutande anmärkningar
Tack för dina kommentarer!