Implementatie op Echte Dataset
Veeg om het menu te tonen
Je gebruikt de mall customers dataset, die de volgende kolommen bevat:
Volg ook deze stappen voordat je gaat clusteren:
- Laad de data: gebruik
pandasom het CSV-bestand te laden; - Selecteer relevante kenmerken: focus op de kolommen
'Annual Income (k$)'en'Spending Score (1-100)'; - Schaal de data (belangrijk voor DBSCAN): omdat DBSCAN afstandsberekeningen gebruikt, is het cruciaal om kenmerken te schalen zodat ze vergelijkbare bereiken hebben. Gebruik hiervoor
StandardScaler.
Interpretatie
De code creëert in dit geval 5 clusters. Het is belangrijk om de resulterende clusters te analyseren om inzicht te krijgen in klantsegmentatie. Bijvoorbeeld, je kunt clusters vinden die het volgende representeren:
- Klanten met hoog inkomen en hoge uitgaven;
- Klanten met hoog inkomen en lage uitgaven;
- Klanten met laag inkomen en hoge uitgaven;
- Klanten met laag inkomen en lage uitgaven;
- Klanten met middeninkomen en gemiddelde uitgaven.
Concluderende opmerkingen
Was alles duidelijk?
Bedankt voor je feedback!
Sectie 5. Hoofdstuk 5
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Geweldig!
Completion tarief verbeterd naar 2.94Sectie 5. Hoofdstuk 5