Summary  
This chapter demonstrates how to preprocess numeric features, apply the DBSCAN density-based clustering algorithm with hyperparameter tuning (eps and min_samples), and visualize resulting clusters and outliers on a real dataset.  

General domain of usage  
Customer segmentation in retail marketing

Du kommer att använda **mall customers**-datamängden, som innehåller följande kolumner:

Du bör även följa dessa steg innan klustring:
     
1.  **Ladda in data:** använd `pandas` för att läsa in CSV-filen;
2.  **Välj relevanta variabler:** fokusera på kolumnerna `'Annual Income (k$)'` och `'Spending Score (1-100)'`;
3.  **Dataskalning (viktigt för DBSCAN):** eftersom DBSCAN använder avståndsberäkningar är det avgörande att skala variablerna till liknande intervall. Använd `StandardScaler` för detta ändamål.

## Tolkning 

Koden skapar **5 kluster** i detta fall. Det är viktigt att analysera de resulterande klustren för att få insikter om **kundsegmentering**. Exempelvis kan du identifiera kluster som representerar: 

- Hög inkomst, hög konsumtion;     
- Hög inkomst, låg konsumtion;    
- Låg inkomst, hög konsumtion;     
- Låg inkomst, låg konsumtion; 
- Medellåg inkomst, medelhög konsumtion.

Vilket påstående beskriver bäst en viktig fördel med att använda DBSCAN för klustring av mallkundsdata?

Utforska kraften i dolda mönster med osupervised learning. Behärska de mest inflytelserika klustringsalgoritmerna, inklusive K-Means, Hierarkisk Klustring, DBSCAN och Gaussiska Mixturmodeller. Lär dig att utvärdera klusterkvalitet med hjälp av WSS och Silhouette-poäng, hantera olika avståndsmått och implementera robusta lösningar på verkliga datamängder. Bygg färdigheter för att segmentera kunder och upptäcka strukturer i oetiketterad data med Scikit-learn.

Implementering på Verklig Datamängd

Tolkning

Avslutande anmärkningar

Implementering på Verklig Datamängd

Tolkning

Avslutande anmärkningar