Implémentation sur un Jeu de Données Réel
Vous utiliserez le jeu de données mall customers, qui contient les colonnes suivantes :
Vous devez également suivre ces étapes avant le regroupement :
- Charger les données : utilisation de
pandas
pour charger le fichier CSV ; - Sélectionner les variables pertinentes : focalisation sur les colonnes
'Annual Income (k$)'
et'Spending Score (1-100)'
; - Mise à l'échelle des données (important pour DBSCAN) : comme DBSCAN utilise des calculs de distance, il est essentiel de mettre à l'échelle les variables pour qu'elles aient des plages similaires. Utilisation possible de
StandardScaler
à cet effet.
Interprétation
Le code crée 5 clusters dans ce cas. Il est important d'analyser les clusters obtenus afin d'obtenir des informations sur la segmentation de la clientèle. Par exemple, il est possible d'identifier des groupes représentant :
-
Clients à revenu élevé et à forte dépense ;
-
Clients à revenu élevé et à faible dépense ;
-
Clients à faible revenu et à forte dépense ;
-
Clients à faible revenu et à faible dépense ;
-
Clients à revenu moyen et à dépense moyenne.
Remarques finales
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 2.94
Implémentation sur un Jeu de Données Réel
Glissez pour afficher le menu
Vous utiliserez le jeu de données mall customers, qui contient les colonnes suivantes :
Vous devez également suivre ces étapes avant le regroupement :
- Charger les données : utilisation de
pandas
pour charger le fichier CSV ; - Sélectionner les variables pertinentes : focalisation sur les colonnes
'Annual Income (k$)'
et'Spending Score (1-100)'
; - Mise à l'échelle des données (important pour DBSCAN) : comme DBSCAN utilise des calculs de distance, il est essentiel de mettre à l'échelle les variables pour qu'elles aient des plages similaires. Utilisation possible de
StandardScaler
à cet effet.
Interprétation
Le code crée 5 clusters dans ce cas. Il est important d'analyser les clusters obtenus afin d'obtenir des informations sur la segmentation de la clientèle. Par exemple, il est possible d'identifier des groupes représentant :
-
Clients à revenu élevé et à forte dépense ;
-
Clients à revenu élevé et à faible dépense ;
-
Clients à faible revenu et à forte dépense ;
-
Clients à faible revenu et à faible dépense ;
-
Clients à revenu moyen et à dépense moyenne.
Remarques finales
Merci pour vos commentaires !