Toteutus Oikealla Tietoaineistolla
Pyyhkäise näyttääksesi valikon
Käytät mall customers -aineistoa, joka sisältää seuraavat sarakkeet:
Noudata myös seuraavia vaiheita ennen klusterointia:
- Lataa data: käytä
pandas-kirjastoa CSV-tiedoston lataamiseen; - Valitse olennaiset ominaisuudet: keskity sarakkeisiin
'Annual Income (k$)'ja'Spending Score (1-100)'; - Datan skaalaus (tärkeää DBSCANille): koska DBSCAN käyttää etäisyyslaskentaa, ominaisuudet on tärkeää skaalata samalle vaihteluvälille. Voit käyttää tähän tarkoitukseen
StandardScaler-luokkaa.
Tulosten tulkinta
Tässä tapauksessa koodi muodostaa 5 klusteria. On tärkeää analysoida muodostuneita klustereita, jotta voidaan saada tietoa asiakassegmentoinnista. Esimerkiksi klusterit voivat edustaa:
- Suurituloisia, paljon kuluttavia asiakkaita;
- Suurituloisia, vähän kuluttavia asiakkaita;
- Pienituloisia, paljon kuluttavia asiakkaita;
- Pienituloisia, vähän kuluttavia asiakkaita;
- Keskituloisia, keskimäärin kuluttavia asiakkaita.
Yhteenveto
Oliko kaikki selvää?
Kiitos palautteestasi!
Osio 5. Luku 5
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Mahtavaa!
Completion arvosana parantunut arvoon 2.94Osio 5. Luku 5