Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Implementazione su un Dataset Fittizio | Sezione
Practice
Projects
Quizzes & Challenges
Quiz
Challenges
/
Fondamenti di Apprendimento Non Supervisionato

bookImplementazione su un Dataset Fittizio

Come di consueto, utilizzerai le seguenti librerie:

  • sklearn per generare dati fittizi e implementare il clustering gerarchico (AgglomerativeClustering);

  • scipy per generare e lavorare con il dendrogramma;

  • matplotlib per visualizzare i cluster e il dendrogramma;

  • numpy per operazioni numeriche.

Generazione di dati fittizi

È possibile utilizzare la funzione make_blobs() di scikit-learn per generare dataset con diversi numeri di cluster e vari gradi di separazione. Questo ti aiuterà a osservare come il clustering gerarchico si comporta in diversi scenari.

L'algoritmo generale è il seguente:

  1. Si istanzia l'oggetto AgglomerativeClustering, specificando il metodo di collegamento e altri parametri;

  2. Si adatta il modello ai dati;

  3. È possibile estrarre le etichette dei cluster se si decide un numero specifico di cluster;

  4. Si visualizzano i cluster (se i dati sono 2D o 3D) utilizzando grafici a dispersione;

  5. Si utilizza la funzione linkage di SciPy per creare la matrice di collegamento e poi dendrogramma per visualizzare il dendrogramma.

È inoltre possibile sperimentare diversi metodi di collegamento (ad esempio, single, complete, average, Ward) e osservare come influenzano i risultati del clustering e la struttura del dendrogramma.

question mark

Quale classe di scikit-learn viene utilizzata per eseguire il clustering gerarchico su un dataset fittizio?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 16

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

bookImplementazione su un Dataset Fittizio

Scorri per mostrare il menu

Come di consueto, utilizzerai le seguenti librerie:

  • sklearn per generare dati fittizi e implementare il clustering gerarchico (AgglomerativeClustering);

  • scipy per generare e lavorare con il dendrogramma;

  • matplotlib per visualizzare i cluster e il dendrogramma;

  • numpy per operazioni numeriche.

Generazione di dati fittizi

È possibile utilizzare la funzione make_blobs() di scikit-learn per generare dataset con diversi numeri di cluster e vari gradi di separazione. Questo ti aiuterà a osservare come il clustering gerarchico si comporta in diversi scenari.

L'algoritmo generale è il seguente:

  1. Si istanzia l'oggetto AgglomerativeClustering, specificando il metodo di collegamento e altri parametri;

  2. Si adatta il modello ai dati;

  3. È possibile estrarre le etichette dei cluster se si decide un numero specifico di cluster;

  4. Si visualizzano i cluster (se i dati sono 2D o 3D) utilizzando grafici a dispersione;

  5. Si utilizza la funzione linkage di SciPy per creare la matrice di collegamento e poi dendrogramma per visualizzare il dendrogramma.

È inoltre possibile sperimentare diversi metodi di collegamento (ad esempio, single, complete, average, Ward) e osservare come influenzano i risultati del clustering e la struttura del dendrogramma.

question mark

Quale classe di scikit-learn viene utilizzata per eseguire il clustering gerarchico su un dataset fittizio?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 16
some-alt