Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Toteutus Oikealla Tietoaineistolla | DBSCAN
Klusterianalyysi

bookToteutus Oikealla Tietoaineistolla

Käytät mall customers -aineistoa, joka sisältää seuraavat sarakkeet:

Noudata myös seuraavia vaiheita ennen klusterointia:

  1. Lataa data: käytä pandas-kirjastoa CSV-tiedoston lataamiseen;
  2. Valitse olennaiset ominaisuudet: keskity sarakkeisiin 'Annual Income (k$)' ja 'Spending Score (1-100)';
  3. Datan skaalaus (tärkeää DBSCANille): koska DBSCAN käyttää etäisyyslaskentaa, on tärkeää, että ominaisuudet ovat samalla mittakaavalla. Voit käyttää tähän tarkoitukseen StandardScaler-luokkaa.

Tulosten tulkinta

Tässä tapauksessa koodi muodostaa 5 klusteria. On tärkeää analysoida muodostuneita klustereita, jotta voidaan saada tietoa asiakassegmentoinnista. Esimerkiksi klusterit voivat edustaa:

  • Suurituloisia, paljon kuluttavia asiakkaita;

  • Suurituloisia, vähän kuluttavia asiakkaita;

  • Pienituloisia, paljon kuluttavia asiakkaita;

  • Pienituloisia, vähän kuluttavia asiakkaita;

  • Keskituloisia, keskimäärin kuluttavia asiakkaita.

Yhteenveto

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 5. Luku 5

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 2.94

bookToteutus Oikealla Tietoaineistolla

Pyyhkäise näyttääksesi valikon

Käytät mall customers -aineistoa, joka sisältää seuraavat sarakkeet:

Noudata myös seuraavia vaiheita ennen klusterointia:

  1. Lataa data: käytä pandas-kirjastoa CSV-tiedoston lataamiseen;
  2. Valitse olennaiset ominaisuudet: keskity sarakkeisiin 'Annual Income (k$)' ja 'Spending Score (1-100)';
  3. Datan skaalaus (tärkeää DBSCANille): koska DBSCAN käyttää etäisyyslaskentaa, on tärkeää, että ominaisuudet ovat samalla mittakaavalla. Voit käyttää tähän tarkoitukseen StandardScaler-luokkaa.

Tulosten tulkinta

Tässä tapauksessa koodi muodostaa 5 klusteria. On tärkeää analysoida muodostuneita klustereita, jotta voidaan saada tietoa asiakassegmentoinnista. Esimerkiksi klusterit voivat edustaa:

  • Suurituloisia, paljon kuluttavia asiakkaita;

  • Suurituloisia, vähän kuluttavia asiakkaita;

  • Pienituloisia, paljon kuluttavia asiakkaita;

  • Pienituloisia, vähän kuluttavia asiakkaita;

  • Keskituloisia, keskimäärin kuluttavia asiakkaita.

Yhteenveto

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 5. Luku 5
some-alt