Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Implementering på Dummy-datasett | Seksjon
Grunnleggende Usupervisert Læring

bookImplementering på Dummy-datasett

Som vanlig bruker du følgende biblioteker:

  • sklearn for å generere dummy-data og implementere hierarkisk klynging (AgglomerativeClustering);

  • scipy for å generere og arbeide med dendrogrammet;

  • matplotlib for å visualisere klynger og dendrogrammet;

  • numpy for numeriske operasjoner.

Generering av dummy-data

Du kan bruke funksjonen make_blobs() fra scikit-learn for å generere datasett med forskjellig antall klynger og varierende grad av separasjon. Dette hjelper deg å se hvordan hierarkisk klynging presterer i ulike scenarier.

Den generelle algoritmen er som følger:

  1. Instansier AgglomerativeClustering-objektet, og spesifiser koblingsmetode og andre parametere;

  2. Tilpass modellen til dataene dine;

  3. Du kan hente ut klyngeetiketter hvis du bestemmer deg for et spesifikt antall klynger;

  4. Visualiser klyngene (hvis dataene er 2D eller 3D) ved hjelp av spredningsdiagrammer;

  5. Bruk SciPy sin linkage for å lage koblingsmatrisen og deretter dendrogram for å visualisere dendrogrammet.

Du kan også eksperimentere med ulike koblingsmetoder (f.eks. single, complete, average, Ward's) og observere hvordan de påvirker klyngeresultatene og strukturen til dendrogrammet.

question mark

Hvilken klasse fra scikit-learn brukes til å utføre hierarkisk klynging på et dummy-datasett?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 16

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

bookImplementering på Dummy-datasett

Sveip for å vise menyen

Som vanlig bruker du følgende biblioteker:

  • sklearn for å generere dummy-data og implementere hierarkisk klynging (AgglomerativeClustering);

  • scipy for å generere og arbeide med dendrogrammet;

  • matplotlib for å visualisere klynger og dendrogrammet;

  • numpy for numeriske operasjoner.

Generering av dummy-data

Du kan bruke funksjonen make_blobs() fra scikit-learn for å generere datasett med forskjellig antall klynger og varierende grad av separasjon. Dette hjelper deg å se hvordan hierarkisk klynging presterer i ulike scenarier.

Den generelle algoritmen er som følger:

  1. Instansier AgglomerativeClustering-objektet, og spesifiser koblingsmetode og andre parametere;

  2. Tilpass modellen til dataene dine;

  3. Du kan hente ut klyngeetiketter hvis du bestemmer deg for et spesifikt antall klynger;

  4. Visualiser klyngene (hvis dataene er 2D eller 3D) ved hjelp av spredningsdiagrammer;

  5. Bruk SciPy sin linkage for å lage koblingsmatrisen og deretter dendrogram for å visualisere dendrogrammet.

Du kan også eksperimentere med ulike koblingsmetoder (f.eks. single, complete, average, Ward's) og observere hvordan de påvirker klyngeresultatene og strukturen til dendrogrammet.

question mark

Hvilken klasse fra scikit-learn brukes til å utføre hierarkisk klynging på et dummy-datasett?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 16
some-alt