Implementering på Virkeligt Datasæt
Du vil bruge mall customers datasættet, som indeholder følgende kolonner:
Du bør også følge disse trin før klyngedannelse:
- Indlæs data: du bruger
pandas
til at indlæse CSV-filen; - Vælg relevante features: du fokuserer på kolonnerne
'Annual Income (k$)'
og'Spending Score (1-100)'
; - Dataskalering (vigtigt for DBSCAN): da DBSCAN anvender afstandsberegninger, er det afgørende at skalere features, så de har lignende intervaller. Du kan bruge
StandardScaler
til dette formål.
Fortolkning
Koden opretter 5 klynger i dette tilfælde. Det er vigtigt at analysere de resulterende klynger for at opnå indsigt i kundesegmentering. For eksempel kan du finde klynger, der repræsenterer:
-
Høj indkomst, højt forbrug;
-
Høj indkomst, lavt forbrug;
-
Lav indkomst, højt forbrug;
-
Lav indkomst, lavt forbrug;
-
Mellem indkomst, mellem forbrug.
Afsluttende bemærkninger
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 2.94
Implementering på Virkeligt Datasæt
Stryg for at vise menuen
Du vil bruge mall customers datasættet, som indeholder følgende kolonner:
Du bør også følge disse trin før klyngedannelse:
- Indlæs data: du bruger
pandas
til at indlæse CSV-filen; - Vælg relevante features: du fokuserer på kolonnerne
'Annual Income (k$)'
og'Spending Score (1-100)'
; - Dataskalering (vigtigt for DBSCAN): da DBSCAN anvender afstandsberegninger, er det afgørende at skalere features, så de har lignende intervaller. Du kan bruge
StandardScaler
til dette formål.
Fortolkning
Koden opretter 5 klynger i dette tilfælde. Det er vigtigt at analysere de resulterende klynger for at opnå indsigt i kundesegmentering. For eksempel kan du finde klynger, der repræsenterer:
-
Høj indkomst, højt forbrug;
-
Høj indkomst, lavt forbrug;
-
Lav indkomst, højt forbrug;
-
Lav indkomst, lavt forbrug;
-
Mellem indkomst, mellem forbrug.
Afsluttende bemærkninger
Tak for dine kommentarer!