Implémentation sur un Jeu de Données Réel
Vous utiliserez le jeu de données mall customers, qui contient les colonnes suivantes :
Vous devez également suivre ces étapes avant le regroupement :
- Charger les données : utilisez
pandaspour charger le fichier CSV ; - Sélectionner les caractéristiques pertinentes : concentrez-vous sur les colonnes
'Annual Income (k$)'et'Spending Score (1-100)'; - Mise à l'échelle des données (important pour DBSCAN) : puisque DBSCAN utilise des calculs de distance, il est essentiel de mettre à l'échelle les caractéristiques pour qu'elles aient des plages similaires. Vous pouvez utiliser
StandardScalerà cet effet.
Interprétation
Le code crée 5 clusters dans ce cas. Il est important d'analyser les clusters obtenus afin d'obtenir des informations sur la segmentation de la clientèle. Par exemple, vous pouvez identifier des clusters représentant :
- Clients à revenu élevé et à forte dépense ;
- Clients à revenu élevé et à faible dépense ;
- Clients à faible revenu et à forte dépense ;
- Clients à faible revenu et à faible dépense ;
- Clients à revenu moyen et à dépense moyenne.
Remarques finales
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Génial!
Completion taux amélioré à 3.23
Implémentation sur un Jeu de Données Réel
Glissez pour afficher le menu
Vous utiliserez le jeu de données mall customers, qui contient les colonnes suivantes :
Vous devez également suivre ces étapes avant le regroupement :
- Charger les données : utilisez
pandaspour charger le fichier CSV ; - Sélectionner les caractéristiques pertinentes : concentrez-vous sur les colonnes
'Annual Income (k$)'et'Spending Score (1-100)'; - Mise à l'échelle des données (important pour DBSCAN) : puisque DBSCAN utilise des calculs de distance, il est essentiel de mettre à l'échelle les caractéristiques pour qu'elles aient des plages similaires. Vous pouvez utiliser
StandardScalerà cet effet.
Interprétation
Le code crée 5 clusters dans ce cas. Il est important d'analyser les clusters obtenus afin d'obtenir des informations sur la segmentation de la clientèle. Par exemple, vous pouvez identifier des clusters représentant :
- Clients à revenu élevé et à forte dépense ;
- Clients à revenu élevé et à faible dépense ;
- Clients à faible revenu et à forte dépense ;
- Clients à faible revenu et à faible dépense ;
- Clients à revenu moyen et à dépense moyenne.
Remarques finales
Merci pour vos commentaires !