Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Implementering på Verklig Datamängd | Dbscan
Klusteranalys med Python

bookImplementering på Verklig Datamängd

Svep för att visa menyn

Du kommer att använda mall customers-datamängden, som innehåller följande kolumner:

Du bör även följa dessa steg innan klustring:

  1. Ladda in data: använd pandas för att ladda CSV-filen;
  2. Välj relevanta variabler: fokusera på kolumnerna 'Annual Income (k$)' och 'Spending Score (1-100)';
  3. Dataskalning (viktigt för DBSCAN): eftersom DBSCAN använder avståndsberäkningar är det avgörande att skala variablerna till liknande intervall. Du kan använda StandardScaler för detta ändamål.

Tolkning

Koden skapar 5 kluster i detta fall. Det är viktigt att analysera de resulterande klustren för att få insikter om kundsegmentering. Till exempel kan du hitta kluster som representerar:

  • Hög inkomst, hög konsumtion;
  • Hög inkomst, låg konsumtion;
  • Låg inkomst, hög konsumtion;
  • Låg inkomst, låg konsumtion;
  • Medellåg inkomst, medelhög konsumtion.

Avslutande anmärkningar

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 5. Kapitel 5

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Avsnitt 5. Kapitel 5
some-alt