Implementatie op Echte Dataset
Je gebruikt de mall customers dataset, die de volgende kolommen bevat:
Volg ook deze stappen voordat je gaat clusteren:
- Laad de data: gebruik
pandas
om het CSV-bestand te laden; - Selecteer relevante kenmerken: focus op de kolommen
'Annual Income (k$)'
en'Spending Score (1-100)'
; - Schaal de data (belangrijk voor DBSCAN): omdat DBSCAN afstandsberekeningen gebruikt, is het cruciaal om kenmerken te schalen zodat ze vergelijkbare bereiken hebben. Gebruik hiervoor
StandardScaler
.
Interpretatie
De code creëert in dit geval 5 clusters. Het is belangrijk om de resulterende clusters te analyseren om inzicht te krijgen in klantsegmentatie. Bijvoorbeeld, je kunt clusters vinden die het volgende representeren:
- Klanten met hoog inkomen en hoge uitgaven;
- Klanten met hoog inkomen en lage uitgaven;
- Klanten met laag inkomen en hoge uitgaven;
- Klanten met laag inkomen en lage uitgaven;
- Klanten met middeninkomen en gemiddelde uitgaven.
Concluderende opmerkingen
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 2.94
Implementatie op Echte Dataset
Veeg om het menu te tonen
Je gebruikt de mall customers dataset, die de volgende kolommen bevat:
Volg ook deze stappen voordat je gaat clusteren:
- Laad de data: gebruik
pandas
om het CSV-bestand te laden; - Selecteer relevante kenmerken: focus op de kolommen
'Annual Income (k$)'
en'Spending Score (1-100)'
; - Schaal de data (belangrijk voor DBSCAN): omdat DBSCAN afstandsberekeningen gebruikt, is het cruciaal om kenmerken te schalen zodat ze vergelijkbare bereiken hebben. Gebruik hiervoor
StandardScaler
.
Interpretatie
De code creëert in dit geval 5 clusters. Het is belangrijk om de resulterende clusters te analyseren om inzicht te krijgen in klantsegmentatie. Bijvoorbeeld, je kunt clusters vinden die het volgende representeren:
- Klanten met hoog inkomen en hoge uitgaven;
- Klanten met hoog inkomen en lage uitgaven;
- Klanten met laag inkomen en hoge uitgaven;
- Klanten met laag inkomen en lage uitgaven;
- Klanten met middeninkomen en gemiddelde uitgaven.
Concluderende opmerkingen
Bedankt voor je feedback!