Filtering of Meaningless Rules and Identification of High-Value Product Bundles
Svep för att visa menyn
För att maximera effekten av market basket-analys måste du särskilja verkligt värdefulla associationsregler från de som är triviala eller irrelevanta för dina affärsmål. Denna process säkerställer att dina rekommendationer och kampanjer baseras på handlingsbara insikter snarare än brus eller uppenbara mönster.
Filtreringskriterier
Det första steget i att filtrera associationsregler är att sätta minimigränser för support, konfidens och lift. Dessa mått hjälper dig att eliminera regler som är för sällsynta för att vara användbara eller som saknar statistisk signifikans.
- Supportgräns: ignorera regler som förekommer i för få transaktioner, eftersom de kan vara avvikare eller sakna affärsrelevans;
- Konfidensgräns: uteslut regler som inte visar tillräckligt starkt samband mellan antecedent och konsekvent;
- Liftgräns: ta bort regler med liftvärden nära eller under 1, eftersom de inte indikerar ett meningsfullt samband utöver slumpen.
Redundans
Många regler i dina gruvresultat kan vara redundanta, vilket innebär att de inte tillför någon ny information jämfört med andra regler. Till exempel, om både "milk → bread" och "milk, butter → bread" har liknande support och konfidens, kanske den mer specifika regeln inte tillför något värde. Att identifiera och ta bort redundanta regler hjälper dig att fokusera på de mest koncisa och informativa mönstren.
Affärsrelevans
Alla statistiskt starka regler är inte användbara för din verksamhet. För att avgöra om en regel är handlingsbar, fråga dig:
- Föreslår regeln en produktkombination som du kan marknadsföra tillsammans?
- Är kombinationen logistiskt möjlig (t.ex. inte para ihop produkter från orelaterade avdelningar)?
- Kan regeln informera om butikslayout eller korsförsäljningsstrategier?
- Stämmer regeln överens med dina affärsmål, såsom att öka korgstorleken eller introducera nya produkter?
Exempel: Filtrering av regler för att isolera högvärdiga paket
Anta att du har utvunnit ett antal associationsregler från din transaktionsdata. Genom att tillämpa tröskelvärden och ta bort redundans kan du isolera en liten uppsättning högvärdiga produktpaket som både är statistiskt signifikanta och överensstämmer med dina affärsmål.
12345678910111213141516171819202122232425262728293031import pandas as pd # Example association rules DataFrame rules = pd.DataFrame({ 'antecedents': [['milk'], ['bread'], ['milk', 'bread'], ['chips'], ['chips', 'salsa']], 'consequents': [['bread'], ['milk'], ['butter'], ['salsa'], ['soft drinks']], 'support': [0.30, 0.28, 0.15, 0.10, 0.08], 'confidence': [0.7, 0.6, 0.5, 0.4, 0.75], 'lift': [1.2, 1.1, 0.95, 1.0, 1.5] }) # Setting filtering thresholds min_support = 0.10 min_confidence = 0.6 min_lift = 1.1 # Filtering rules by thresholds and explicitly creating a copy filtered_rules = rules[ (rules['support'] >= min_support) & (rules['confidence'] >= min_confidence) & (rules['lift'] >= min_lift) ].copy() # Removing redundant rules: keep only the most general (shortest antecedents) filtered_rules['antecedent_length'] = filtered_rules['antecedents'].apply(len) non_redundant_rules = filtered_rules.sort_values('antecedent_length').drop_duplicates('consequents') # Identifying top product bundles (by lift) top_bundles = non_redundant_rules.sort_values('lift', ascending=False) print(top_bundles[['antecedents', 'consequents', 'support', 'confidence', 'lift']])
1. Vad är huvudorsaken till att sätta en minsta lift-gräns när man filtrerar associationsregler?
2. Vilket av följande beskriver bäst en redundant associationsregel?
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal