Реалізація на реальному наборі даних
Ви будете використовувати набір даних mall customers, який містить такі стовпці:
Також слід виконати такі кроки перед кластеризацією:
- Завантаження даних: використовуйте
pandas
для завантаження CSV-файлу; - Вибір релевантних ознак: зосередьтеся на стовпцях
'Annual Income (k$)'
та'Spending Score (1-100)'
; - Масштабування даних (важливо для DBSCAN): оскільки DBSCAN використовує обчислення відстаней, важливо масштабувати ознаки до подібних діапазонів. Для цього можна використати
StandardScaler
.
Інтерпретація
У цьому випадку код створює 5 кластерів. Важливо проаналізувати отримані кластери, щоб отримати уявлення про сегментацію клієнтів. Наприклад, можна виявити кластери, що представляють:
-
Клієнти з високим доходом і високими витратами;
-
Клієнти з високим доходом і низькими витратами;
-
Клієнти з низьким доходом і високими витратами;
-
Клієнти з низьким доходом і низькими витратами;
-
Клієнти із середнім доходом і середніми витратами.
Підсумкові зауваження
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 2.94
Реалізація на реальному наборі даних
Свайпніть щоб показати меню
Ви будете використовувати набір даних mall customers, який містить такі стовпці:
Також слід виконати такі кроки перед кластеризацією:
- Завантаження даних: використовуйте
pandas
для завантаження CSV-файлу; - Вибір релевантних ознак: зосередьтеся на стовпцях
'Annual Income (k$)'
та'Spending Score (1-100)'
; - Масштабування даних (важливо для DBSCAN): оскільки DBSCAN використовує обчислення відстаней, важливо масштабувати ознаки до подібних діапазонів. Для цього можна використати
StandardScaler
.
Інтерпретація
У цьому випадку код створює 5 кластерів. Важливо проаналізувати отримані кластери, щоб отримати уявлення про сегментацію клієнтів. Наприклад, можна виявити кластери, що представляють:
-
Клієнти з високим доходом і високими витратами;
-
Клієнти з високим доходом і низькими витратами;
-
Клієнти з низьким доходом і високими витратами;
-
Клієнти з низьким доходом і низькими витратами;
-
Клієнти із середнім доходом і середніми витратами.
Підсумкові зауваження
Дякуємо за ваш відгук!