Filtrering av meningsløse regler og identifisering av høyverdige produktpakker
Sveip for å vise menyen
For å maksimere effekten av market basket-analyse må du skille ut virkelig verdifulle assosiasjonsregler fra de som enten er trivielle eller irrelevante for dine forretningsmål. Denne prosessen sikrer at anbefalinger og kampanjer baseres på handlingsrettet innsikt, og ikke på støy eller åpenbare mønstre.
Filtreringskriterier
Første steg i filtrering av assosiasjonsregler er å sette minimumsterskler for support, confidence og lift. Disse målene hjelper deg å eliminere regler som enten er for sjeldne til å være nyttige eller ikke er statistisk signifikante.
- Support-terskel: ignorer regler som forekommer i for få transaksjoner, da de kan være avvik eller mangle forretningsmessig betydning;
- Confidence-terskel: forkast regler som ikke viser sterk nok sammenheng mellom antecedent og konsekvent;
- Lift-terskel: fjern regler med lift-verdier nær eller under 1, da de ikke indikerer en meningsfull sammenheng utover tilfeldigheter.
Redundans
Mange regler i resultatene fra utvinningen kan være redundante, noe som betyr at de ikke gir ny informasjon sammenlignet med andre regler. For eksempel, hvis både "milk → bread" og "milk, butter → bread" har lignende support og confidence, tilfører ikke den mer spesifikke regelen ekstra verdi. Å identifisere og fjerne redundante regler hjelper deg å fokusere på de mest konsise og informative mønstrene.
Forretningsrelevans
Ikke alle statistisk sterke regler er nyttige for virksomheten. For å avgjøre om en regel er handlingsbar, vurder:
- Foreslår regelen en produktkombinasjon som kan promoteres sammen?
- Er kombinasjonen logistisk gjennomførbar (f.eks. ikke kombinere produkter fra helt ulike avdelinger)?
- Kan regelen informere utforming av butikk eller kryssalg-strategier?
- Stemmer regelen overens med forretningsmål, som å øke handlekurvstørrelse eller introdusere nye produkter?
Eksempel: Filtrering av regler for å isolere verdifulle produktpakker
Anta at du har utvunnet et sett med assosiasjonsregler fra transaksjonsdataene dine. Ved å bruke terskler og fjerne redundans kan du isolere et lite sett med verdifulle produktpakker som både er statistisk signifikante og samsvarer med forretningsmålene dine.
12345678910111213141516171819202122232425262728293031import pandas as pd # Example association rules DataFrame rules = pd.DataFrame({ 'antecedents': [['milk'], ['bread'], ['milk', 'bread'], ['chips'], ['chips', 'salsa']], 'consequents': [['bread'], ['milk'], ['butter'], ['salsa'], ['soft drinks']], 'support': [0.30, 0.28, 0.15, 0.10, 0.08], 'confidence': [0.7, 0.6, 0.5, 0.4, 0.75], 'lift': [1.2, 1.1, 0.95, 1.0, 1.5] }) # Setting filtering thresholds min_support = 0.10 min_confidence = 0.6 min_lift = 1.1 # Filtering rules by thresholds and explicitly creating a copy filtered_rules = rules[ (rules['support'] >= min_support) & (rules['confidence'] >= min_confidence) & (rules['lift'] >= min_lift) ].copy() # Removing redundant rules: keep only the most general (shortest antecedents) filtered_rules['antecedent_length'] = filtered_rules['antecedents'].apply(len) non_redundant_rules = filtered_rules.sort_values('antecedent_length').drop_duplicates('consequents') # Identifying top product bundles (by lift) top_bundles = non_redundant_rules.sort_values('lift', ascending=False) print(top_bundles[['antecedents', 'consequents', 'support', 'confidence', 'lift']])
1. Hva er hovedårsaken til å sette en minimumsterskel for lift når man filtrerer assosiasjonsregler?
2. Hvilket av følgende beskriver best en redundant assosiasjonsregel?
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår