Реалізація на реальному наборі даних
Свайпніть щоб показати меню
Ви будете використовувати набір даних mall customers, який містить такі стовпці:
Також слід виконати наступні кроки перед кластеризацією:
- Завантаження даних: використання
pandasдля завантаження CSV-файлу; - Вибір релевантних ознак: фокусування на стовпцях
'Annual Income (k$)'та'Spending Score (1-100)'; - Масштабування даних (важливо для DBSCAN): оскільки DBSCAN використовує обчислення відстаней, важливо масштабувати ознаки до подібних діапазонів. Для цього можна використати
StandardScaler.
Інтерпретація
У цьому випадку код створює 5 кластерів. Важливо проаналізувати отримані кластери для отримання уявлення про сегментацію клієнтів. Наприклад, можна виявити кластери, що представляють:
- Клієнти з високим доходом і високими витратами;
- Клієнти з високим доходом і низькими витратами;
- Клієнти з низьким доходом і високими витратами;
- Клієнти з низьким доходом і низькими витратами;
- Клієнти із середнім доходом і середніми витратами.
Підсумкові зауваження
Все було зрозуміло?
Дякуємо за ваш відгук!
Секція 5. Розділ 5
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Чудово!
Completion показник покращився до 2.94Секція 5. Розділ 5