Filtrering af meningsløse regler og identifikation af højværdiproduktpakker
Stryg for at vise menuen
For at maksimere effekten af market basket-analyse skal du adskille de virkelig værdifulde associationsregler fra dem, der enten er trivielle eller irrelevante for dine forretningsmål. Denne proces sikrer, at dine anbefalinger og kampagner er baseret på handlingsorienteret indsigt frem for støj eller åbenlyse mønstre.
Filtreringskriterier
Det første skridt i filtrering af associationsregler er at fastsætte minimumstærskler for support, confidence og lift. Disse målinger hjælper dig med at udelukke regler, der enten er for sjældne til at være nyttige eller ikke er statistisk signifikante.
- Support-tærskel: ignorer regler, der forekommer i for få transaktioner, da de kan være outliers eller mangle forretningsmæssig betydning;
- Confidence-tærskel: kassér regler, der ikke viser stærk nok sammenhæng mellem antecedent og konsekvent;
- Lift-tærskel: fjern regler med lift-værdier tæt på eller under 1, da de ikke indikerer en meningsfuld sammenhæng ud over tilfældigheder.
Redundans
Mange regler i dine minedata kan være redundante, hvilket betyder, at de ikke giver ny information sammenlignet med andre regler. For eksempel, hvis både "milk → bread" og "milk, butter → bread" har lignende support og confidence, tilføjer den mere specifikke regel måske ikke værdi. Identifikation og fjernelse af redundante regler hjælper dig med at fokusere på de mest præcise og informative mønstre.
Forretningsrelevans
Ikke alle statistisk stærke regler er nyttige for din forretning. For at afgøre, om en regel er handlingsbar, bør du spørge:
- Foreslår reglen en produktkombination, som du kan promovere sammen?
- Er kombinationen logistisk mulig (f.eks. ikke at parre produkter fra ikke-relaterede afdelinger)?
- Kan reglen informere om butiksindretning eller krydssalg?
- Stemmer reglen overens med dine forretningsmål, såsom at øge kurvstørrelsen eller introducere nye produkter?
Eksempel: Filtrering af regler for at isolere værdifulde produktbundter
Antag, at du har udvundet et sæt associationsregler fra dine transaktionsdata. Ved at anvende tærskler og fjerne redundans kan du isolere et lille sæt værdifulde produktbundter, der både er statistisk signifikante og stemmer overens med dine forretningsmål.
12345678910111213141516171819202122232425262728293031import pandas as pd # Example association rules DataFrame rules = pd.DataFrame({ 'antecedents': [['milk'], ['bread'], ['milk', 'bread'], ['chips'], ['chips', 'salsa']], 'consequents': [['bread'], ['milk'], ['butter'], ['salsa'], ['soft drinks']], 'support': [0.30, 0.28, 0.15, 0.10, 0.08], 'confidence': [0.7, 0.6, 0.5, 0.4, 0.75], 'lift': [1.2, 1.1, 0.95, 1.0, 1.5] }) # Setting filtering thresholds min_support = 0.10 min_confidence = 0.6 min_lift = 1.1 # Filtering rules by thresholds and explicitly creating a copy filtered_rules = rules[ (rules['support'] >= min_support) & (rules['confidence'] >= min_confidence) & (rules['lift'] >= min_lift) ].copy() # Removing redundant rules: keep only the most general (shortest antecedents) filtered_rules['antecedent_length'] = filtered_rules['antecedents'].apply(len) non_redundant_rules = filtered_rules.sort_values('antecedent_length').drop_duplicates('consequents') # Identifying top product bundles (by lift) top_bundles = non_redundant_rules.sort_values('lift', ascending=False) print(top_bundles[['antecedents', 'consequents', 'support', 'confidence', 'lift']])
1. Hvad er hovedårsagen til at sætte en minimum lift-tærskel, når man filtrerer associationsregler?
2. Hvilket af følgende beskriver bedst en redundant associationsregel?
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat