Implementering på Verklig Datamängd
Svep för att visa menyn
Du kommer att använda mall customers-datamängden, som innehåller följande kolumner:
Du bör även följa dessa steg innan klustring:
- Ladda in data: använd
pandasför att läsa in CSV-filen; - Välj relevanta variabler: fokusera på kolumnerna
'Annual Income (k$)'och'Spending Score (1-100)'; - Dataskalning (viktigt för DBSCAN): eftersom DBSCAN använder avståndsberäkningar är det avgörande att skala variablerna till liknande intervall. Använd
StandardScalerför detta ändamål.
Tolkning
Koden skapar 5 kluster i detta fall. Det är viktigt att analysera de resulterande klustren för att få insikter om kundsegmentering. Exempelvis kan du identifiera kluster som representerar:
- Hög inkomst, hög konsumtion;
- Hög inkomst, låg konsumtion;
- Låg inkomst, hög konsumtion;
- Låg inkomst, låg konsumtion;
- Medellåg inkomst, medelhög konsumtion.
Avslutande anmärkningar
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 1. Kapitel 23
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Avsnitt 1. Kapitel 23