Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Filtering Meaningless Rules and Identifying High-Value Product Bundles | Extraction de Règles Haute Performance et Optimisation de l'Échelle
Analyse du Panier de Marché et Systèmes de Recommandation

Filtering Meaningless Rules and Identifying High-Value Product Bundles

Glissez pour afficher le menu

Pour maximiser l'impact de l'analyse du panier d'achat, il est essentiel de distinguer les règles d'association réellement pertinentes de celles qui sont soit triviales, soit non pertinentes pour vos objectifs commerciaux. Ce processus garantit que vos recommandations et promotions reposent sur des informations exploitables plutôt que sur du bruit ou des schémas évidents.

Critères de filtrage

La première étape du filtrage des règles d'association consiste à définir des seuils minimaux pour le support, la confiance et le lift. Ces métriques permettent d'éliminer les règles trop rares pour être utiles ou qui ne sont pas statistiquement significatives.

  • Seuil de support : ignorer les règles qui apparaissent dans trop peu de transactions, car elles peuvent être des valeurs aberrantes ou manquer d'impact commercial ;
  • Seuil de confiance : écarter les règles qui ne montrent pas une association suffisamment forte entre l'antécédent et le conséquent ;
  • Seuil de lift : supprimer les règles dont la valeur de lift est proche ou inférieure à 1, car elles n'indiquent pas une association significative au-delà du hasard.

Redondance

De nombreuses règles issues de vos résultats de fouille peuvent être redondantes, c'est-à-dire qu'elles n'apportent aucune information nouvelle par rapport à d'autres règles. Par exemple, si "milk → bread" et "milk, butter → bread" présentent un support et une confiance similaires, la règle la plus spécifique peut ne pas ajouter de valeur. Identifier et supprimer les règles redondantes permet de se concentrer sur les schémas les plus concis et informatifs.

Pertinence métier

Toutes les règles statistiquement fortes ne sont pas utiles pour votre entreprise. Pour déterminer si une règle est exploitable, posez-vous les questions suivantes :

  • La règle suggère-t-elle une association de produits que vous pouvez promouvoir ensemble ?
  • La combinaison est-elle logiquement réalisable (par exemple, ne pas associer des produits de départements sans lien) ?
  • La règle peut-elle orienter l'agencement du magasin ou les stratégies de vente croisée ?
  • La règle est-elle en adéquation avec vos objectifs commerciaux, comme l'augmentation du panier moyen ou l'introduction de nouveaux produits ?

Exemple : filtrer les règles pour isoler des lots de produits à forte valeur ajoutée

Supposons que vous ayez extrait un ensemble de règles d'association à partir de vos données de transactions. En appliquant des seuils et en supprimant la redondance, vous pouvez isoler un petit ensemble de lots de produits à forte valeur ajoutée, à la fois statistiquement significatifs et alignés avec vos objectifs commerciaux.

12345678910111213141516171819202122232425262728293031
import pandas as pd # Example association rules DataFrame rules = pd.DataFrame({ 'antecedents': [['milk'], ['bread'], ['milk', 'bread'], ['chips'], ['chips', 'salsa']], 'consequents': [['bread'], ['milk'], ['butter'], ['salsa'], ['soft drinks']], 'support': [0.30, 0.28, 0.15, 0.10, 0.08], 'confidence': [0.7, 0.6, 0.5, 0.4, 0.75], 'lift': [1.2, 1.1, 0.95, 1.0, 1.5] }) # Setting filtering thresholds min_support = 0.10 min_confidence = 0.6 min_lift = 1.1 # Filtering rules by thresholds and explicitly creating a copy filtered_rules = rules[ (rules['support'] >= min_support) & (rules['confidence'] >= min_confidence) & (rules['lift'] >= min_lift) ].copy() # Removing redundant rules: keep only the most general (shortest antecedents) filtered_rules['antecedent_length'] = filtered_rules['antecedents'].apply(len) non_redundant_rules = filtered_rules.sort_values('antecedent_length').drop_duplicates('consequents') # Identifying top product bundles (by lift) top_bundles = non_redundant_rules.sort_values('lift', ascending=False) print(top_bundles[['antecedents', 'consequents', 'support', 'confidence', 'lift']])

1. Quelle est la principale raison de fixer un seuil minimal de lift lors du filtrage des règles d'association ?

2. Laquelle des propositions suivantes décrit le mieux une règle d'association redondante ?

question mark

Quelle est la principale raison de fixer un seuil minimal de lift lors du filtrage des règles d'association ?

Sélectionnez la réponse correcte

question mark

Laquelle des propositions suivantes décrit le mieux une règle d'association redondante ?

Sélectionnez la réponse correcte

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 4

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Section 2. Chapitre 4
some-alt