Implementering på Ekte Datasett
Sveip for å vise menyen
Du skal bruke mall customers-datasettet, som inneholder følgende kolonner:
Følg også disse stegene før klynging:
- Last inn data: bruk
pandasfor å laste inn CSV-filen; - Velg relevante variabler: fokuser på kolonnene
'Annual Income (k$)'og'Spending Score (1-100)'; - Skalering av data (viktig for DBSCAN): siden DBSCAN benytter avstandsmålinger, er det avgjørende å skalere variablene slik at de har lignende intervaller. Du kan bruke
StandardScalertil dette formålet.
Tolkning
Koden oppretter 5 klynger i dette tilfellet. Det er viktig å analysere de resulterende klyngene for å få innsikt i kundesegmentering. For eksempel kan du finne klynger som representerer:
- Høy inntekt, høyt forbruk;
- Høy inntekt, lavt forbruk;
- Lav inntekt, høyt forbruk;
- Lav inntekt, lavt forbruk;
- Middels inntekt, middels forbruk.
Avsluttende bemerkninger
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 1. Kapittel 23
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Seksjon 1. Kapittel 23