Implementatie op Echte Dataset
Je gebruikt de mall customers dataset, die de volgende kolommen bevat:
Volg daarnaast deze stappen voordat je gaat clusteren:
- Laad de data: gebruik
pandasom het CSV-bestand te laden; - Selecteer relevante kenmerken: focus op de kolommen
'Annual Income (k$)'en'Spending Score (1-100)'; - Schaal de data (belangrijk voor DBSCAN): omdat DBSCAN afstandsberekeningen gebruikt, is het essentieel om kenmerken te schalen zodat ze vergelijkbare bereiken hebben. Gebruik hiervoor
StandardScaler.
Interpretatie
De code creëert in dit geval 5 clusters. Het is belangrijk om de resulterende clusters te analyseren om inzicht te krijgen in klantsegmentatie. Bijvoorbeeld, je kunt clusters vinden die het volgende vertegenwoordigen:
- Klanten met een hoog inkomen en hoge uitgaven;
- Klanten met een hoog inkomen en lage uitgaven;
- Klanten met een laag inkomen en hoge uitgaven;
- Klanten met een laag inkomen en lage uitgaven;
- Klanten met een gemiddeld inkomen en gemiddelde uitgaven.
Slotopmerkingen
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Geweldig!
Completion tarief verbeterd naar 3.23
Implementatie op Echte Dataset
Veeg om het menu te tonen
Je gebruikt de mall customers dataset, die de volgende kolommen bevat:
Volg daarnaast deze stappen voordat je gaat clusteren:
- Laad de data: gebruik
pandasom het CSV-bestand te laden; - Selecteer relevante kenmerken: focus op de kolommen
'Annual Income (k$)'en'Spending Score (1-100)'; - Schaal de data (belangrijk voor DBSCAN): omdat DBSCAN afstandsberekeningen gebruikt, is het essentieel om kenmerken te schalen zodat ze vergelijkbare bereiken hebben. Gebruik hiervoor
StandardScaler.
Interpretatie
De code creëert in dit geval 5 clusters. Het is belangrijk om de resulterende clusters te analyseren om inzicht te krijgen in klantsegmentatie. Bijvoorbeeld, je kunt clusters vinden die het volgende vertegenwoordigen:
- Klanten met een hoog inkomen en hoge uitgaven;
- Klanten met een hoog inkomen en lage uitgaven;
- Klanten met een laag inkomen en hoge uitgaven;
- Klanten met een laag inkomen en lage uitgaven;
- Klanten met een gemiddeld inkomen en gemiddelde uitgaven.
Slotopmerkingen
Bedankt voor je feedback!