Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Implémentation sur un Jeu de Données Fictif | Section
Fondamentaux de l'apprentissage non supervisé

bookImplémentation sur un Jeu de Données Fictif

Vous allez créer deux ensembles de données pour illustrer les points forts de DBSCAN :

  • Moons : deux demi-cercles entrelacés ;
  • Circles : un petit cercle à l'intérieur d'un cercle plus grand.

L'algorithme est le suivant :

  1. Instanciation de l'objet DBSCAN en définissant eps et min_samples ;
  2. Ajustement du modèle sur vos données ;
  3. Visualisation des résultats en traçant les points de données et en les coloriant selon leurs étiquettes de cluster attribuées.

Réglage des hyperparamètres

Le choix de eps et min_samples influence fortement le résultat du clustering. Tester différentes valeurs pour déterminer ce qui convient le mieux à vos données. Par exemple, si eps est trop grand, tous les points peuvent se retrouver dans un seul cluster. Si eps est trop petit, de nombreux points peuvent être classés comme bruit. Il est également possible de mettre à l'échelle les caractéristiques.

question mark

Quelle affirmation décrit le mieux l'effet du paramètre eps dans le clustering DBSCAN ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 22

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

bookImplémentation sur un Jeu de Données Fictif

Glissez pour afficher le menu

Vous allez créer deux ensembles de données pour illustrer les points forts de DBSCAN :

  • Moons : deux demi-cercles entrelacés ;
  • Circles : un petit cercle à l'intérieur d'un cercle plus grand.

L'algorithme est le suivant :

  1. Instanciation de l'objet DBSCAN en définissant eps et min_samples ;
  2. Ajustement du modèle sur vos données ;
  3. Visualisation des résultats en traçant les points de données et en les coloriant selon leurs étiquettes de cluster attribuées.

Réglage des hyperparamètres

Le choix de eps et min_samples influence fortement le résultat du clustering. Tester différentes valeurs pour déterminer ce qui convient le mieux à vos données. Par exemple, si eps est trop grand, tous les points peuvent se retrouver dans un seul cluster. Si eps est trop petit, de nombreux points peuvent être classés comme bruit. Il est également possible de mettre à l'échelle les caractéristiques.

question mark

Quelle affirmation décrit le mieux l'effet du paramètre eps dans le clustering DBSCAN ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 22
some-alt