Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Miten DBSCAN Toimii? | DBSCAN
Klusterianalyysi

bookMiten DBSCAN Toimii?

DBSCAN toimii tiheysulottuvuuden periaatteella. Se määrittelee klusterit tiheinä datapisteiden alueina, joita erottaa harvemman tiheyden alueet. Kaksi keskeistä parametria ohjaa sen toimintaa:

  • Epsilon (ε): säde, jonka sisällä etsitään naapuripisteitä;

  • Minimipisteiden määrä (MinPts): vähimmäismäärä pisteitä, jotka vaaditaan ε-säteen sisällä tiheän alueen muodostamiseksi (mukaan lukien itse piste).

DBSCAN luokittelee pisteet kolmeen kategoriaan:

  • Ydinkohdat: piste on ydinkohta, jos sillä on vähintään MinPts ε-säteen sisällä;

  • Reunapisteet: piste on reunapiste, jos sillä on vähemmän kuin MinPts ε-säteen sisällä, mutta se on saavutettavissa ydinkohdasta (eli se on ydinkohdan ε-säteen sisällä);

  • Kohina: piste, joka ei ole ydinkohta eikä reunapiste, luokitellaan kohinaksi.

Algoritmi

  1. Aloita satunnaisesta käymättömästä pisteestä;

  2. Etsi kaikki pisteet sen ε-säteen sisältä;

  3. Jos pisteellä on vähintään MinPts naapuria ε-säteen sisällä, se merkitään ydinkohdaksi, jolloin aloitetaan uusi klusteri, joka laajenee rekursiivisesti lisäämällä kaikki suoraan tiheysulottuvat pisteet;

  4. Jos ε-säteen sisällä olevien pisteiden määrä on vähemmän kuin MinPts, merkitse piste reunapisteeksi (jos se on ydinkohdan ε-säteen sisällä) tai kohinaksi (jos ei ole);

  5. Toista vaiheet 1–4, kunnes kaikki pisteet on käyty läpi.

Kuvittele hajontakuvio datapisteistä. DBSCAN aloittaa valitsemalla pisteen. Jos se löytää tarpeeksi naapureita ε-säteen sisällä, se merkitsee sen ydinkohdaksi ja alkaa muodostaa klusteria. Tämän jälkeen klusteria laajennetaan tarkistamalla ydinkohdan naapurit ja heidän naapurinsa, ja niin edelleen. Pisteet, jotka ovat lähellä ydinkohtaa mutta joilla ei itsellään ole tarpeeksi naapureita, merkitään reunapisteiksi. Eristyneet pisteet tunnistetaan kohinaksi.

question mark

Mikä ehto DBSCAN:ssa tulee täyttyä, jotta piste luokitellaan ydinpisteeksi?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 5. Luku 2

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 2.94

bookMiten DBSCAN Toimii?

Pyyhkäise näyttääksesi valikon

DBSCAN toimii tiheysulottuvuuden periaatteella. Se määrittelee klusterit tiheinä datapisteiden alueina, joita erottaa harvemman tiheyden alueet. Kaksi keskeistä parametria ohjaa sen toimintaa:

  • Epsilon (ε): säde, jonka sisällä etsitään naapuripisteitä;

  • Minimipisteiden määrä (MinPts): vähimmäismäärä pisteitä, jotka vaaditaan ε-säteen sisällä tiheän alueen muodostamiseksi (mukaan lukien itse piste).

DBSCAN luokittelee pisteet kolmeen kategoriaan:

  • Ydinkohdat: piste on ydinkohta, jos sillä on vähintään MinPts ε-säteen sisällä;

  • Reunapisteet: piste on reunapiste, jos sillä on vähemmän kuin MinPts ε-säteen sisällä, mutta se on saavutettavissa ydinkohdasta (eli se on ydinkohdan ε-säteen sisällä);

  • Kohina: piste, joka ei ole ydinkohta eikä reunapiste, luokitellaan kohinaksi.

Algoritmi

  1. Aloita satunnaisesta käymättömästä pisteestä;

  2. Etsi kaikki pisteet sen ε-säteen sisältä;

  3. Jos pisteellä on vähintään MinPts naapuria ε-säteen sisällä, se merkitään ydinkohdaksi, jolloin aloitetaan uusi klusteri, joka laajenee rekursiivisesti lisäämällä kaikki suoraan tiheysulottuvat pisteet;

  4. Jos ε-säteen sisällä olevien pisteiden määrä on vähemmän kuin MinPts, merkitse piste reunapisteeksi (jos se on ydinkohdan ε-säteen sisällä) tai kohinaksi (jos ei ole);

  5. Toista vaiheet 1–4, kunnes kaikki pisteet on käyty läpi.

Kuvittele hajontakuvio datapisteistä. DBSCAN aloittaa valitsemalla pisteen. Jos se löytää tarpeeksi naapureita ε-säteen sisällä, se merkitsee sen ydinkohdaksi ja alkaa muodostaa klusteria. Tämän jälkeen klusteria laajennetaan tarkistamalla ydinkohdan naapurit ja heidän naapurinsa, ja niin edelleen. Pisteet, jotka ovat lähellä ydinkohtaa mutta joilla ei itsellään ole tarpeeksi naapureita, merkitään reunapisteiksi. Eristyneet pisteet tunnistetaan kohinaksi.

question mark

Mikä ehto DBSCAN:ssa tulee täyttyä, jotta piste luokitellaan ydinpisteeksi?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 5. Luku 2
some-alt