Реалізація на реальному наборі даних
Ви будете використовувати набір даних mall customers, який містить такі стовпці:
Також слід виконати наступні кроки перед кластеризацією:
- Завантаження даних: використання
pandas
для завантаження CSV-файлу; - Вибір релевантних ознак: фокусування на стовпцях
'Annual Income (k$)'
та'Spending Score (1-100)'
; - Масштабування даних (важливо для DBSCAN): оскільки DBSCAN використовує обчислення відстаней, важливо масштабувати ознаки до подібних діапазонів. Для цього можна використати
StandardScaler
.
Інтерпретація
У цьому випадку код створює 5 кластерів. Важливо проаналізувати отримані кластери для отримання уявлення про сегментацію клієнтів. Наприклад, можна виявити кластери, що представляють:
- Клієнти з високим доходом і високими витратами;
- Клієнти з високим доходом і низькими витратами;
- Клієнти з низьким доходом і високими витратами;
- Клієнти з низьким доходом і низькими витратами;
- Клієнти із середнім доходом і середніми витратами.
Підсумкові зауваження
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Can you explain how to choose the best values for epsilon and min_samples in DBSCAN?
What are some practical tips for interpreting the clusters found by DBSCAN?
How does DBSCAN compare to K-means and hierarchical clustering in real-world scenarios?
Awesome!
Completion rate improved to 2.94
Реалізація на реальному наборі даних
Свайпніть щоб показати меню
Ви будете використовувати набір даних mall customers, який містить такі стовпці:
Також слід виконати наступні кроки перед кластеризацією:
- Завантаження даних: використання
pandas
для завантаження CSV-файлу; - Вибір релевантних ознак: фокусування на стовпцях
'Annual Income (k$)'
та'Spending Score (1-100)'
; - Масштабування даних (важливо для DBSCAN): оскільки DBSCAN використовує обчислення відстаней, важливо масштабувати ознаки до подібних діапазонів. Для цього можна використати
StandardScaler
.
Інтерпретація
У цьому випадку код створює 5 кластерів. Важливо проаналізувати отримані кластери для отримання уявлення про сегментацію клієнтів. Наприклад, можна виявити кластери, що представляють:
- Клієнти з високим доходом і високими витратами;
- Клієнти з високим доходом і низькими витратами;
- Клієнти з низьким доходом і високими витратами;
- Клієнти з низьким доходом і низькими витратами;
- Клієнти із середнім доходом і середніми витратами.
Підсумкові зауваження
Дякуємо за ваш відгук!