Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Реалізація на реальному наборі даних | DBSCAN
Кластерний Аналіз

bookРеалізація на реальному наборі даних

Ви будете використовувати набір даних mall customers, який містить такі стовпці:

Також слід виконати такі кроки перед кластеризацією:

  1. Завантаження даних: використовуйте pandas для завантаження CSV-файлу;
  2. Вибір релевантних ознак: зосередьтеся на стовпцях 'Annual Income (k$)' та 'Spending Score (1-100)';
  3. Масштабування даних (важливо для DBSCAN): оскільки DBSCAN використовує обчислення відстаней, важливо масштабувати ознаки до подібних діапазонів. Для цього можна використати StandardScaler.

Інтерпретація

У цьому випадку код створює 5 кластерів. Важливо проаналізувати отримані кластери, щоб отримати уявлення про сегментацію клієнтів. Наприклад, можна виявити кластери, що представляють:

  • Клієнти з високим доходом і високими витратами;

  • Клієнти з високим доходом і низькими витратами;

  • Клієнти з низьким доходом і високими витратами;

  • Клієнти з низьким доходом і низькими витратами;

  • Клієнти із середнім доходом і середніми витратами.

Підсумкові зауваження

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 5. Розділ 5

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Awesome!

Completion rate improved to 2.94

bookРеалізація на реальному наборі даних

Свайпніть щоб показати меню

Ви будете використовувати набір даних mall customers, який містить такі стовпці:

Також слід виконати такі кроки перед кластеризацією:

  1. Завантаження даних: використовуйте pandas для завантаження CSV-файлу;
  2. Вибір релевантних ознак: зосередьтеся на стовпцях 'Annual Income (k$)' та 'Spending Score (1-100)';
  3. Масштабування даних (важливо для DBSCAN): оскільки DBSCAN використовує обчислення відстаней, важливо масштабувати ознаки до подібних діапазонів. Для цього можна використати StandardScaler.

Інтерпретація

У цьому випадку код створює 5 кластерів. Важливо проаналізувати отримані кластери, щоб отримати уявлення про сегментацію клієнтів. Наприклад, можна виявити кластери, що представляють:

  • Клієнти з високим доходом і високими витратами;

  • Клієнти з високим доходом і низькими витратами;

  • Клієнти з низьким доходом і високими витратами;

  • Клієнти з низьким доходом і низькими витратами;

  • Клієнти із середнім доходом і середніми витратами.

Підсумкові зауваження

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 5. Розділ 5
some-alt