Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Filtrering af meningsløse regler og identifikation af højværdiproduktpakker | High Performance Rule Mining and Scale Optimization
Market Basket Analyse og Anbefalingssystemer

Filtrering af meningsløse regler og identifikation af højværdiproduktpakker

Stryg for at vise menuen

For at maksimere effekten af market basket-analyse skal du adskille de virkelig værdifulde associationsregler fra dem, der enten er trivielle eller irrelevante for dine forretningsmål. Denne proces sikrer, at dine anbefalinger og kampagner er baseret på handlingsorienteret indsigt frem for støj eller åbenlyse mønstre.

Filtreringskriterier

Det første skridt i filtrering af associationsregler er at fastsætte minimumstærskler for support, confidence og lift. Disse målinger hjælper dig med at udelukke regler, der enten er for sjældne til at være nyttige eller ikke er statistisk signifikante.

  • Support-tærskel: ignorer regler, der forekommer i for få transaktioner, da de kan være outliers eller mangle forretningsmæssig betydning;
  • Confidence-tærskel: kassér regler, der ikke viser stærk nok sammenhæng mellem antecedent og konsekvent;
  • Lift-tærskel: fjern regler med lift-værdier tæt på eller under 1, da de ikke indikerer en meningsfuld sammenhæng ud over tilfældigheder.

Redundans

Mange regler i dine minedata kan være redundante, hvilket betyder, at de ikke giver ny information sammenlignet med andre regler. For eksempel, hvis både "milk → bread" og "milk, butter → bread" har lignende support og confidence, tilføjer den mere specifikke regel måske ikke værdi. Identifikation og fjernelse af redundante regler hjælper dig med at fokusere på de mest præcise og informative mønstre.

Forretningsrelevans

Ikke alle statistisk stærke regler er nyttige for din forretning. For at afgøre, om en regel er handlingsbar, bør du spørge:

  • Foreslår reglen en produktkombination, som du kan promovere sammen?
  • Er kombinationen logistisk mulig (f.eks. ikke at parre produkter fra ikke-relaterede afdelinger)?
  • Kan reglen informere om butiksindretning eller krydssalg?
  • Stemmer reglen overens med dine forretningsmål, såsom at øge kurvstørrelsen eller introducere nye produkter?

Eksempel: Filtrering af regler for at isolere værdifulde produktbundter

Antag, at du har udvundet et sæt associationsregler fra dine transaktionsdata. Ved at anvende tærskler og fjerne redundans kan du isolere et lille sæt værdifulde produktbundter, der både er statistisk signifikante og stemmer overens med dine forretningsmål.

12345678910111213141516171819202122232425262728293031
import pandas as pd # Example association rules DataFrame rules = pd.DataFrame({ 'antecedents': [['milk'], ['bread'], ['milk', 'bread'], ['chips'], ['chips', 'salsa']], 'consequents': [['bread'], ['milk'], ['butter'], ['salsa'], ['soft drinks']], 'support': [0.30, 0.28, 0.15, 0.10, 0.08], 'confidence': [0.7, 0.6, 0.5, 0.4, 0.75], 'lift': [1.2, 1.1, 0.95, 1.0, 1.5] }) # Setting filtering thresholds min_support = 0.10 min_confidence = 0.6 min_lift = 1.1 # Filtering rules by thresholds and explicitly creating a copy filtered_rules = rules[ (rules['support'] >= min_support) & (rules['confidence'] >= min_confidence) & (rules['lift'] >= min_lift) ].copy() # Removing redundant rules: keep only the most general (shortest antecedents) filtered_rules['antecedent_length'] = filtered_rules['antecedents'].apply(len) non_redundant_rules = filtered_rules.sort_values('antecedent_length').drop_duplicates('consequents') # Identifying top product bundles (by lift) top_bundles = non_redundant_rules.sort_values('lift', ascending=False) print(top_bundles[['antecedents', 'consequents', 'support', 'confidence', 'lift']])

1. Hvad er hovedårsagen til at sætte en minimum lift-tærskel, når man filtrerer associationsregler?

2. Hvilket af følgende beskriver bedst en redundant associationsregel?

question mark

Hvad er hovedårsagen til at sætte en minimum lift-tærskel, når man filtrerer associationsregler?

Vælg det korrekte svar

question mark

Hvilket af følgende beskriver bedst en redundant associationsregel?

Vælg det korrekte svar

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 4

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Sektion 2. Kapitel 4
some-alt