Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Filtering of Meaningless Rules and Identification of High-Value Product Bundles | Högpresterande regelutvinning och skaloptimering
Market Basket Analysis och Rekommendationssystem

Filtering of Meaningless Rules and Identification of High-Value Product Bundles

Svep för att visa menyn

För att maximera effekten av market basket-analys måste du särskilja verkligt värdefulla associationsregler från de som är triviala eller irrelevanta för dina affärsmål. Denna process säkerställer att dina rekommendationer och kampanjer baseras på handlingsbara insikter snarare än brus eller uppenbara mönster.

Filtreringskriterier

Det första steget i att filtrera associationsregler är att sätta minimigränser för support, konfidens och lift. Dessa mått hjälper dig att eliminera regler som är för sällsynta för att vara användbara eller som saknar statistisk signifikans.

  • Supportgräns: ignorera regler som förekommer i för få transaktioner, eftersom de kan vara avvikare eller sakna affärsrelevans;
  • Konfidensgräns: uteslut regler som inte visar tillräckligt starkt samband mellan antecedent och konsekvent;
  • Liftgräns: ta bort regler med liftvärden nära eller under 1, eftersom de inte indikerar ett meningsfullt samband utöver slumpen.

Redundans

Många regler i dina gruvresultat kan vara redundanta, vilket innebär att de inte tillför någon ny information jämfört med andra regler. Till exempel, om både "milk → bread" och "milk, butter → bread" har liknande support och konfidens, kanske den mer specifika regeln inte tillför något värde. Att identifiera och ta bort redundanta regler hjälper dig att fokusera på de mest koncisa och informativa mönstren.

Affärsrelevans

Alla statistiskt starka regler är inte användbara för din verksamhet. För att avgöra om en regel är handlingsbar, fråga dig:

  • Föreslår regeln en produktkombination som du kan marknadsföra tillsammans?
  • Är kombinationen logistiskt möjlig (t.ex. inte para ihop produkter från orelaterade avdelningar)?
  • Kan regeln informera om butikslayout eller korsförsäljningsstrategier?
  • Stämmer regeln överens med dina affärsmål, såsom att öka korgstorleken eller introducera nya produkter?

Exempel: Filtrering av regler för att isolera högvärdiga paket

Anta att du har utvunnit ett antal associationsregler från din transaktionsdata. Genom att tillämpa tröskelvärden och ta bort redundans kan du isolera en liten uppsättning högvärdiga produktpaket som både är statistiskt signifikanta och överensstämmer med dina affärsmål.

12345678910111213141516171819202122232425262728293031
import pandas as pd # Example association rules DataFrame rules = pd.DataFrame({ 'antecedents': [['milk'], ['bread'], ['milk', 'bread'], ['chips'], ['chips', 'salsa']], 'consequents': [['bread'], ['milk'], ['butter'], ['salsa'], ['soft drinks']], 'support': [0.30, 0.28, 0.15, 0.10, 0.08], 'confidence': [0.7, 0.6, 0.5, 0.4, 0.75], 'lift': [1.2, 1.1, 0.95, 1.0, 1.5] }) # Setting filtering thresholds min_support = 0.10 min_confidence = 0.6 min_lift = 1.1 # Filtering rules by thresholds and explicitly creating a copy filtered_rules = rules[ (rules['support'] >= min_support) & (rules['confidence'] >= min_confidence) & (rules['lift'] >= min_lift) ].copy() # Removing redundant rules: keep only the most general (shortest antecedents) filtered_rules['antecedent_length'] = filtered_rules['antecedents'].apply(len) non_redundant_rules = filtered_rules.sort_values('antecedent_length').drop_duplicates('consequents') # Identifying top product bundles (by lift) top_bundles = non_redundant_rules.sort_values('lift', ascending=False) print(top_bundles[['antecedents', 'consequents', 'support', 'confidence', 'lift']])

1. Vad är huvudorsaken till att sätta en minsta lift-gräns när man filtrerar associationsregler?

2. Vilket av följande beskriver bäst en redundant associationsregel?

question mark

Vad är huvudorsaken till att sätta en minsta lift-gräns när man filtrerar associationsregler?

Vänligen välj det korrekta svaret

question mark

Vilket av följande beskriver bäst en redundant associationsregel?

Vänligen välj det korrekta svaret

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 2. Kapitel 4

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Avsnitt 2. Kapitel 4
some-alt