Implémentation sur un Jeu de Données Fictif
Glissez pour afficher le menu
Vous allez créer deux ensembles de données pour démontrer les atouts de DBSCAN :
- Moons : deux demi-cercles entrelacés ;
- Circles : un petit cercle à l'intérieur d'un cercle plus grand.
L'algorithme est le suivant :
-
Instanciation de l'objet
DBSCANen définissantepsetmin_samples; -
Ajustement du modèle sur les données ;
-
Visualisation des résultats en affichant les points de données et en les coloriant selon leurs étiquettes de cluster attribuées.
Réglage des hyperparamètres
Le choix de eps et min_samples influence fortement le résultat du clustering. Tester différentes valeurs pour déterminer celles qui conviennent le mieux à vos données. Par exemple, si eps est trop grand, tous les points peuvent se retrouver dans un seul cluster. Si eps est trop petit, de nombreux points peuvent être classés comme bruit. Il est également possible de mettre à l'échelle les variables.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion