Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Implementatie op Echte Dataset | Dbscan
Clusteranalyse

bookImplementatie op Echte Dataset

Je gebruikt de mall customers dataset, die de volgende kolommen bevat:

Volg ook deze stappen voordat je gaat clusteren:

  1. Laad de data: gebruik pandas om het CSV-bestand te laden;
  2. Selecteer relevante kenmerken: focus op de kolommen 'Annual Income (k$)' en 'Spending Score (1-100)';
  3. Schaal de data (belangrijk voor DBSCAN): omdat DBSCAN afstandsberekeningen gebruikt, is het cruciaal om kenmerken te schalen zodat ze vergelijkbare bereiken hebben. Gebruik hiervoor StandardScaler.

Interpretatie

De code creëert in dit geval 5 clusters. Het is belangrijk om de resulterende clusters te analyseren om inzicht te krijgen in klantsegmentatie. Bijvoorbeeld, je kunt clusters vinden die het volgende representeren:

  • Klanten met hoog inkomen en hoge uitgaven;
  • Klanten met hoog inkomen en lage uitgaven;
  • Klanten met laag inkomen en hoge uitgaven;
  • Klanten met laag inkomen en lage uitgaven;
  • Klanten met middeninkomen en gemiddelde uitgaven.

Concluderende opmerkingen

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 5

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Awesome!

Completion rate improved to 2.94

bookImplementatie op Echte Dataset

Veeg om het menu te tonen

Je gebruikt de mall customers dataset, die de volgende kolommen bevat:

Volg ook deze stappen voordat je gaat clusteren:

  1. Laad de data: gebruik pandas om het CSV-bestand te laden;
  2. Selecteer relevante kenmerken: focus op de kolommen 'Annual Income (k$)' en 'Spending Score (1-100)';
  3. Schaal de data (belangrijk voor DBSCAN): omdat DBSCAN afstandsberekeningen gebruikt, is het cruciaal om kenmerken te schalen zodat ze vergelijkbare bereiken hebben. Gebruik hiervoor StandardScaler.

Interpretatie

De code creëert in dit geval 5 clusters. Het is belangrijk om de resulterende clusters te analyseren om inzicht te krijgen in klantsegmentatie. Bijvoorbeeld, je kunt clusters vinden die het volgende representeren:

  • Klanten met hoog inkomen en hoge uitgaven;
  • Klanten met hoog inkomen en lage uitgaven;
  • Klanten met laag inkomen en hoge uitgaven;
  • Klanten met laag inkomen en lage uitgaven;
  • Klanten met middeninkomen en gemiddelde uitgaven.

Concluderende opmerkingen

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 5
some-alt