Implementatie op Echte Dataset
Je gebruikt de mall customers dataset, die de volgende kolommen bevat:
Volg daarnaast deze stappen voordat je gaat clusteren:
- Gegevens laden: gebruik
pandas
om het CSV-bestand te laden; - Relevante kenmerken selecteren: focus op de kolommen
'Annual Income (k$)'
en'Spending Score (1-100)'
; - Schaalverdeling van gegevens (belangrijk voor DBSCAN): omdat DBSCAN afstandsberekeningen gebruikt, is het essentieel om kenmerken te schalen zodat ze vergelijkbare bereiken hebben. Gebruik hiervoor
StandardScaler
.
Interpretatie
De code creëert in dit geval 5 clusters. Het is belangrijk om de resulterende clusters te analyseren om inzicht te krijgen in klantsegmentatie. Bijvoorbeeld, je kunt clusters vinden die het volgende vertegenwoordigen:
-
Klanten met hoog inkomen en hoge bestedingen;
-
Klanten met hoog inkomen en lage bestedingen;
-
Klanten met laag inkomen en hoge bestedingen;
-
Klanten met laag inkomen en lage bestedingen;
-
Klanten met middeninkomen en gemiddelde bestedingen.
Concluderende opmerkingen
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 2.94
Implementatie op Echte Dataset
Veeg om het menu te tonen
Je gebruikt de mall customers dataset, die de volgende kolommen bevat:
Volg daarnaast deze stappen voordat je gaat clusteren:
- Gegevens laden: gebruik
pandas
om het CSV-bestand te laden; - Relevante kenmerken selecteren: focus op de kolommen
'Annual Income (k$)'
en'Spending Score (1-100)'
; - Schaalverdeling van gegevens (belangrijk voor DBSCAN): omdat DBSCAN afstandsberekeningen gebruikt, is het essentieel om kenmerken te schalen zodat ze vergelijkbare bereiken hebben. Gebruik hiervoor
StandardScaler
.
Interpretatie
De code creëert in dit geval 5 clusters. Het is belangrijk om de resulterende clusters te analyseren om inzicht te krijgen in klantsegmentatie. Bijvoorbeeld, je kunt clusters vinden die het volgende vertegenwoordigen:
-
Klanten met hoog inkomen en hoge bestedingen;
-
Klanten met hoog inkomen en lage bestedingen;
-
Klanten met laag inkomen en hoge bestedingen;
-
Klanten met laag inkomen en lage bestedingen;
-
Klanten met middeninkomen en gemiddelde bestedingen.
Concluderende opmerkingen
Bedankt voor je feedback!