Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Implementering på Verklig Datamängd | Sektion
Practice
Projects
Quizzes & Challenges
Frågesporter
Challenges
/
Grunderna i osupervised learning

bookImplementering på Verklig Datamängd

Du kommer att använda mall customers-datamängden, som innehåller följande kolumner:

Du bör även följa dessa steg innan klustring:

  1. Ladda in data: använd pandas för att läsa in CSV-filen;
  2. Välj relevanta variabler: fokusera på kolumnerna 'Annual Income (k$)' och 'Spending Score (1-100)';
  3. Dataskalning (viktigt för DBSCAN): eftersom DBSCAN använder avståndsberäkningar är det avgörande att skala variablerna till liknande intervall. Använd StandardScaler för detta ändamål.

Tolkning

Koden skapar 5 kluster i detta fall. Det är viktigt att analysera de resulterande klustren för att få insikter om kundsegmentering. Exempelvis kan du identifiera kluster som representerar:

  • Hög inkomst, hög konsumtion;
  • Hög inkomst, låg konsumtion;
  • Låg inkomst, hög konsumtion;
  • Låg inkomst, låg konsumtion;
  • Medellåg inkomst, medelhög konsumtion.

Avslutande anmärkningar

question mark

Vilket påstående beskriver bäst en viktig fördel med att använda DBSCAN för klustring av mallkundsdata?

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 23

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

bookImplementering på Verklig Datamängd

Svep för att visa menyn

Du kommer att använda mall customers-datamängden, som innehåller följande kolumner:

Du bör även följa dessa steg innan klustring:

  1. Ladda in data: använd pandas för att läsa in CSV-filen;
  2. Välj relevanta variabler: fokusera på kolumnerna 'Annual Income (k$)' och 'Spending Score (1-100)';
  3. Dataskalning (viktigt för DBSCAN): eftersom DBSCAN använder avståndsberäkningar är det avgörande att skala variablerna till liknande intervall. Använd StandardScaler för detta ändamål.

Tolkning

Koden skapar 5 kluster i detta fall. Det är viktigt att analysera de resulterande klustren för att få insikter om kundsegmentering. Exempelvis kan du identifiera kluster som representerar:

  • Hög inkomst, hög konsumtion;
  • Hög inkomst, låg konsumtion;
  • Låg inkomst, hög konsumtion;
  • Låg inkomst, låg konsumtion;
  • Medellåg inkomst, medelhög konsumtion.

Avslutande anmärkningar

question mark

Vilket påstående beskriver bäst en viktig fördel med att använda DBSCAN för klustring av mallkundsdata?

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 23
some-alt