Implementering på et Rigtigt Datasæt
Stryg for at vise menuen
Du vil bruge mall customers datasættet, som indeholder følgende kolonner:
Du bør også følge disse trin før klyngedannelse:
- Indlæs data: du bruger
pandastil at indlæse CSV-filen; - Vælg relevante features: fokus er på kolonnerne
'Annual Income (k$)'og'Spending Score (1-100)'; - Skalering af data (vigtigt for DBSCAN): da DBSCAN anvender afstandsberegninger, er det afgørende at skalere features, så de har lignende intervaller. Du kan bruge
StandardScalertil dette formål.
Fortolkning
Koden opretter 5 klynger i dette tilfælde. Det er vigtigt at analysere de resulterende klynger for at opnå indsigt i kundesegmentering. For eksempel kan du finde klynger, der repræsenterer:
- Høj indkomst, højt forbrug;
- Høj indkomst, lavt forbrug;
- Lav indkomst, højt forbrug;
- Lav indkomst, lavt forbrug;
- Mellem indkomst, mellem forbrug.
Afsluttende bemærkninger
Var alt klart?
Tak for dine kommentarer!
Sektion 5. Kapitel 5
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Fantastisk!
Completion rate forbedret til 2.94Sektion 5. Kapitel 5