Implémentation sur un Jeu de Données Fictif
Vous allez créer deux jeux de données pour démontrer les atouts de DBSCAN :
- Moons : deux demi-cercles entrelacés ;
- Circles : un petit cercle à l'intérieur d'un cercle plus grand.
L'algorithme est le suivant :
-
Instanciation de l'objet
DBSCAN
en définissanteps
etmin_samples
; -
Ajustement du modèle sur vos données ;
-
Visualisation des résultats en traçant les points de données et en les coloriant selon leurs étiquettes de cluster attribuées.
Réglage des hyperparamètres
Le choix de eps
et min_samples
influence fortement le résultat du clustering. Il est recommandé d'expérimenter différentes valeurs pour déterminer ce qui convient le mieux à vos données. Par exemple, si eps
est trop grand, tous les points pourraient se retrouver dans un seul cluster. Si eps
est trop petit, de nombreux points pourraient être classés comme bruit. Il est également possible de mettre à l'échelle les variables.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you explain how DBSCAN determines core points and border points?
What are some practical tips for choosing the right values for epsilon and min_samples?
How does DBSCAN compare to K-means for these types of datasets?
Awesome!
Completion rate improved to 2.94
Implémentation sur un Jeu de Données Fictif
Glissez pour afficher le menu
Vous allez créer deux jeux de données pour démontrer les atouts de DBSCAN :
- Moons : deux demi-cercles entrelacés ;
- Circles : un petit cercle à l'intérieur d'un cercle plus grand.
L'algorithme est le suivant :
-
Instanciation de l'objet
DBSCAN
en définissanteps
etmin_samples
; -
Ajustement du modèle sur vos données ;
-
Visualisation des résultats en traçant les points de données et en les coloriant selon leurs étiquettes de cluster attribuées.
Réglage des hyperparamètres
Le choix de eps
et min_samples
influence fortement le résultat du clustering. Il est recommandé d'expérimenter différentes valeurs pour déterminer ce qui convient le mieux à vos données. Par exemple, si eps
est trop grand, tous les points pourraient se retrouver dans un seul cluster. Si eps
est trop petit, de nombreux points pourraient être classés comme bruit. Il est également possible de mettre à l'échelle les variables.
Merci pour vos commentaires !