Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Implementatie op Echte Dataset | Sectie
Practice
Projects
Quizzes & Challenges
Quizzen
Challenges
/
Essentiële Unsupervised Learning

bookImplementatie op Echte Dataset

Je gebruikt de mall customers dataset, die de volgende kolommen bevat:

Volg daarnaast deze stappen voordat je gaat clusteren:

  1. Laad de data: gebruik pandas om het CSV-bestand te laden;
  2. Selecteer relevante kenmerken: focus op de kolommen 'Annual Income (k$)' en 'Spending Score (1-100)';
  3. Schaal de data (belangrijk voor DBSCAN): omdat DBSCAN afstandsberekeningen gebruikt, is het essentieel om kenmerken te schalen zodat ze vergelijkbare bereiken hebben. Gebruik hiervoor StandardScaler.

Interpretatie

De code creëert in dit geval 5 clusters. Het is belangrijk om de resulterende clusters te analyseren om inzicht te krijgen in klantsegmentatie. Bijvoorbeeld, je kunt clusters vinden die het volgende vertegenwoordigen:

  • Klanten met een hoog inkomen en hoge uitgaven;
  • Klanten met een hoog inkomen en lage uitgaven;
  • Klanten met een laag inkomen en hoge uitgaven;
  • Klanten met een laag inkomen en lage uitgaven;
  • Klanten met een gemiddeld inkomen en gemiddelde uitgaven.

Slotopmerkingen

question mark

Welke uitspraak beschrijft het beste een belangrijk voordeel van het gebruik van DBSCAN voor het clusteren van de winkelklantendataset?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 23

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

bookImplementatie op Echte Dataset

Veeg om het menu te tonen

Je gebruikt de mall customers dataset, die de volgende kolommen bevat:

Volg daarnaast deze stappen voordat je gaat clusteren:

  1. Laad de data: gebruik pandas om het CSV-bestand te laden;
  2. Selecteer relevante kenmerken: focus op de kolommen 'Annual Income (k$)' en 'Spending Score (1-100)';
  3. Schaal de data (belangrijk voor DBSCAN): omdat DBSCAN afstandsberekeningen gebruikt, is het essentieel om kenmerken te schalen zodat ze vergelijkbare bereiken hebben. Gebruik hiervoor StandardScaler.

Interpretatie

De code creëert in dit geval 5 clusters. Het is belangrijk om de resulterende clusters te analyseren om inzicht te krijgen in klantsegmentatie. Bijvoorbeeld, je kunt clusters vinden die het volgende vertegenwoordigen:

  • Klanten met een hoog inkomen en hoge uitgaven;
  • Klanten met een hoog inkomen en lage uitgaven;
  • Klanten met een laag inkomen en hoge uitgaven;
  • Klanten met een laag inkomen en lage uitgaven;
  • Klanten met een gemiddeld inkomen en gemiddelde uitgaven.

Slotopmerkingen

question mark

Welke uitspraak beschrijft het beste een belangrijk voordeel van het gebruik van DBSCAN voor het clusteren van de winkelklantendataset?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 23
some-alt