Toteutus Oikealla Tietoaineistolla
Pyyhkäise näyttääksesi valikon
Käytössäsi on mall customers -aineisto, joka sisältää seuraavat sarakkeet:
Noudata myös seuraavia vaiheita ennen klusterointia:
- Lataa data: käytä
pandas-kirjastoa CSV-tiedoston lataamiseen; - Valitse olennaiset ominaisuudet: keskity sarakkeisiin
'Annual Income (k$)'ja'Spending Score (1-100)'; - Datan skaalaus (tärkeää DBSCANille): koska DBSCAN käyttää etäisyyslaskentaa, ominaisuudet on tärkeää skaalata samalle vaihteluvälille. Voit käyttää tähän tarkoitukseen
StandardScaler-luokkaa.
Tulosten tulkinta
Tämä koodi muodostaa 5 klusteria. On tärkeää analysoida muodostuneita klustereita, jotta voidaan saada tietoa asiakassegmentoinnista. Esimerkiksi klusterit voivat edustaa:
- Suurituloisia, paljon kuluttavia asiakkaita;
- Suurituloisia, vähän kuluttavia asiakkaita;
- Pienituloisia, paljon kuluttavia asiakkaita;
- Pienituloisia, vähän kuluttavia asiakkaita;
- Keskituloisia, keskimääräisesti kuluttavia asiakkaita.
Yhteenveto
Oliko kaikki selvää?
Kiitos palautteestasi!
Osio 1. Luku 23
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Osio 1. Luku 23