Implementering på Verklig Datamängd
Svep för att visa menyn
Du kommer att använda mall customers-datamängden, som innehåller följande kolumner:
Du bör även följa dessa steg innan klustring:
- Ladda in data: använd
pandasför att ladda CSV-filen; - Välj relevanta variabler: fokusera på kolumnerna
'Annual Income (k$)'och'Spending Score (1-100)'; - Dataskalning (viktigt för DBSCAN): eftersom DBSCAN använder avståndsberäkningar är det avgörande att skala variablerna till liknande intervall. Du kan använda
StandardScalerför detta ändamål.
Tolkning
Koden skapar 5 kluster i detta fall. Det är viktigt att analysera de resulterande klustren för att få insikter om kundsegmentering. Till exempel kan du hitta kluster som representerar:
- Hög inkomst, hög konsumtion;
- Hög inkomst, låg konsumtion;
- Låg inkomst, hög konsumtion;
- Låg inkomst, låg konsumtion;
- Medellåg inkomst, medelhög konsumtion.
Avslutande anmärkningar
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 5. Kapitel 5
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Fantastiskt!
Completion betyg förbättrat till 2.94Avsnitt 5. Kapitel 5