Toteutus Oikealla Tietoaineistolla
Käytössäsi on mall customers -aineisto, joka sisältää seuraavat sarakkeet:
Noudata myös seuraavia vaiheita ennen klusterointia:
- Lataa data: käytä
pandas-kirjastoa CSV-tiedoston lataamiseen; - Valitse olennaiset ominaisuudet: keskity sarakkeisiin
'Annual Income (k$)'ja'Spending Score (1-100)'; - Datan skaalaus (tärkeää DBSCANille): koska DBSCAN käyttää etäisyyslaskentaa, ominaisuudet on tärkeää skaalata samalle vaihteluvälille. Voit käyttää tähän tarkoitukseen
StandardScaler-luokkaa.
Tulosten tulkinta
Tämä koodi muodostaa 5 klusteria. On tärkeää analysoida muodostuneita klustereita, jotta voidaan saada tietoa asiakassegmentoinnista. Esimerkiksi klusterit voivat edustaa:
- Suurituloisia, paljon kuluttavia asiakkaita;
- Suurituloisia, vähän kuluttavia asiakkaita;
- Pienituloisia, paljon kuluttavia asiakkaita;
- Pienituloisia, vähän kuluttavia asiakkaita;
- Keskituloisia, keskimääräisesti kuluttavia asiakkaita.
Yhteenveto
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Mahtavaa!
Completion arvosana parantunut arvoon 3.23
Toteutus Oikealla Tietoaineistolla
Pyyhkäise näyttääksesi valikon
Käytössäsi on mall customers -aineisto, joka sisältää seuraavat sarakkeet:
Noudata myös seuraavia vaiheita ennen klusterointia:
- Lataa data: käytä
pandas-kirjastoa CSV-tiedoston lataamiseen; - Valitse olennaiset ominaisuudet: keskity sarakkeisiin
'Annual Income (k$)'ja'Spending Score (1-100)'; - Datan skaalaus (tärkeää DBSCANille): koska DBSCAN käyttää etäisyyslaskentaa, ominaisuudet on tärkeää skaalata samalle vaihteluvälille. Voit käyttää tähän tarkoitukseen
StandardScaler-luokkaa.
Tulosten tulkinta
Tämä koodi muodostaa 5 klusteria. On tärkeää analysoida muodostuneita klustereita, jotta voidaan saada tietoa asiakassegmentoinnista. Esimerkiksi klusterit voivat edustaa:
- Suurituloisia, paljon kuluttavia asiakkaita;
- Suurituloisia, vähän kuluttavia asiakkaita;
- Pienituloisia, paljon kuluttavia asiakkaita;
- Pienituloisia, vähän kuluttavia asiakkaita;
- Keskituloisia, keskimääräisesti kuluttavia asiakkaita.
Yhteenveto
Kiitos palautteestasi!