Implementatie op Echte Dataset
Veeg om het menu te tonen
Je gebruikt de mall customers dataset, die de volgende kolommen bevat:
Volg daarnaast deze stappen voordat je gaat clusteren:
- Laad de data: gebruik
pandasom het CSV-bestand te laden; - Selecteer relevante kenmerken: focus op de kolommen
'Annual Income (k$)'en'Spending Score (1-100)'; - Schaal de data (belangrijk voor DBSCAN): omdat DBSCAN afstandsberekeningen gebruikt, is het essentieel om kenmerken te schalen zodat ze vergelijkbare bereiken hebben. Gebruik hiervoor
StandardScaler.
Interpretatie
De code creëert in dit geval 5 clusters. Het is belangrijk om de resulterende clusters te analyseren om inzicht te krijgen in klantsegmentatie. Bijvoorbeeld, je kunt clusters vinden die het volgende vertegenwoordigen:
- Klanten met een hoog inkomen en hoge uitgaven;
- Klanten met een hoog inkomen en lage uitgaven;
- Klanten met een laag inkomen en hoge uitgaven;
- Klanten met een laag inkomen en lage uitgaven;
- Klanten met een gemiddeld inkomen en gemiddelde uitgaven.
Slotopmerkingen
Was alles duidelijk?
Bedankt voor je feedback!
Sectie 1. Hoofdstuk 23
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Sectie 1. Hoofdstuk 23