Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Фільтрація беззмістовних правил та виявлення високовартісних товарних наборів | Високопродуктивний пошук правил та оптимізація масштабування
Аналіз кошика покупок і системи рекомендацій

Фільтрація беззмістовних правил та виявлення високовартісних товарних наборів

Свайпніть щоб показати меню

Для максимізації ефективності аналізу кошика покупок необхідно відокремити справді цінні асоціативні правила від тих, що є тривіальними або не мають відношення до бізнес-цілей. Цей процес гарантує, що ваші рекомендації та акції ґрунтуються на практичних висновках, а не на шумі чи очевидних закономірностях.

Критерії фільтрації

Перший крок у фільтрації асоціативних правил — встановлення мінімальних порогів для support (підтримки), confidence (довіри) та lift (підняття). Ці метрики допомагають відсіяти правила, які є надто рідкісними або статистично незначущими.

  • Поріг підтримки: ігнорування правил, що зустрічаються у надто малій кількості транзакцій, оскільки вони можуть бути аномаліями або не мати бізнес-ефекту;
  • Поріг довіри: відкидання правил, які не демонструють достатньо сильної асоціації між антецедентом і консеквентом;
  • Поріг підняття: видалення правил із lift, близьким до 1 або менше, оскільки вони не вказують на значущу асоціацію понад випадковість.

Надлишковість

Багато правил у результатах майнінгу можуть бути надлишковими, тобто не містити нової інформації порівняно з іншими правилами. Наприклад, якщо і "milk → bread", і "milk, butter → bread" мають схожі показники підтримки та довіри, більш специфічне правило може не додавати цінності. Виявлення та видалення надлишкових правил допомагає зосередитися на найбільш лаконічних та інформативних закономірностях.

Бізнес-значущість

Не всі статистично сильні правила корисні для бізнесу. Щоб визначити, чи є правило практичним, варто запитати:

  • Чи пропонує правило таку комбінацію товарів, яку можна просувати разом?
  • Чи є комбінація логістично здійсненною (наприклад, не поєднує товари з різних відділів)?
  • Чи може правило вплинути на розміщення товарів у магазині або стратегії крос-продажів?
  • Чи відповідає правило бізнес-цілям, наприклад, збільшенню розміру кошика або впровадженню нових товарів?

Приклад: фільтрація правил для виділення цінних комбінацій товарів

Припустимо, ви отримали набір асоціативних правил із транзакційних даних. Застосувавши пороги та видаливши надлишковість, можна виділити невелику кількість цінних комбінацій товарів, які є статистично значущими та відповідають бізнес-цілям.

12345678910111213141516171819202122232425262728293031
import pandas as pd # Example association rules DataFrame rules = pd.DataFrame({ 'antecedents': [['milk'], ['bread'], ['milk', 'bread'], ['chips'], ['chips', 'salsa']], 'consequents': [['bread'], ['milk'], ['butter'], ['salsa'], ['soft drinks']], 'support': [0.30, 0.28, 0.15, 0.10, 0.08], 'confidence': [0.7, 0.6, 0.5, 0.4, 0.75], 'lift': [1.2, 1.1, 0.95, 1.0, 1.5] }) # Setting filtering thresholds min_support = 0.10 min_confidence = 0.6 min_lift = 1.1 # Filtering rules by thresholds and explicitly creating a copy filtered_rules = rules[ (rules['support'] >= min_support) & (rules['confidence'] >= min_confidence) & (rules['lift'] >= min_lift) ].copy() # Removing redundant rules: keep only the most general (shortest antecedents) filtered_rules['antecedent_length'] = filtered_rules['antecedents'].apply(len) non_redundant_rules = filtered_rules.sort_values('antecedent_length').drop_duplicates('consequents') # Identifying top product bundles (by lift) top_bundles = non_redundant_rules.sort_values('lift', ascending=False) print(top_bundles[['antecedents', 'consequents', 'support', 'confidence', 'lift']])

1. Яка основна причина встановлення мінімального порогу lift при фільтрації асоціативних правил?

2. Яке з наведених найкраще описує надлишкове правило асоціації?

question mark

Яка основна причина встановлення мінімального порогу lift при фільтрації асоціативних правил?

Виберіть правильну відповідь

question mark

Яке з наведених найкраще описує надлишкове правило асоціації?

Виберіть правильну відповідь

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 4

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Секція 2. Розділ 4
some-alt