Summary  
This chapter demonstrates how to preprocess numeric features, apply the DBSCAN density-based clustering algorithm with hyperparameter tuning (eps and min_samples), and visualize resulting clusters and outliers on a real dataset.  

General domain of usage  
Customer segmentation in retail marketing

Du skal bruke **mall customers**-datasettet, som inneholder følgende kolonner:

Følg også disse stegene før klynging:
     
1.  **Last inn data:** bruk `pandas` for å laste inn CSV-filen;
2.  **Velg relevante variabler:** fokuser på kolonnene `'Annual Income (k$)'` og `'Spending Score (1-100)'`;
3.  **Skalering av data (viktig for DBSCAN):** siden DBSCAN benytter avstandsmålinger, er det avgjørende å skalere variablene slik at de har lignende intervaller. Du kan bruke `StandardScaler` til dette formålet.

## Tolkning 

Koden oppretter **5 klynger** i dette tilfellet. Det er viktig å analysere de resulterende klyngene for å få innsikt i **kundesegmentering**. For eksempel kan du finne klynger som representerer: 

- Høy inntekt, høyt forbruk;     
- Høy inntekt, lavt forbruk;    
- Lav inntekt, høyt forbruk;     
- Lav inntekt, lavt forbruk; 
- Middels inntekt, middels forbruk.

Hvilket utsagn beskriver best en sentral fordel ved å bruke DBSCAN for å klynge kundedata fra kjøpesenteret?

Utforsk kraften i skjulte mønstre med usupervisert læring. Behersk de mest innflytelsesrike klyngealgoritmene, inkludert K-Means, hierarkisk klynging, DBSCAN og Gaussiske blandingsmodeller. Lær å evaluere klyngekvalitet ved hjelp av WSS og Silhouette-score, håndtere ulike avstandsmål og implementere robuste løsninger på virkelige datasett. Bygg ferdigheter for å segmentere kunder og oppdage strukturer i umerkede data ved bruk av Scikit-learn.

Implementering på Ekte Datasett

Tolkning

Avsluttende bemerkninger

Implementering på Ekte Datasett

Tolkning

Avsluttende bemerkninger