Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Het Filteren van Zinloze Regels en het Identificeren van Waardevolle Productbundels | Hoogwaardige Regelmijnbouw en Schaaloptimalisatie
Market Basket Analyse en Aanbevelingssystemen

Het Filteren van Zinloze Regels en het Identificeren van Waardevolle Productbundels

Veeg om het menu te tonen

Om de impact van market basket-analyse te maximaliseren, is het noodzakelijk om werkelijk waardevolle associatieregels te scheiden van regels die triviaal of irrelevant zijn voor de bedrijfsdoelstellingen. Dit proces zorgt ervoor dat aanbevelingen en promoties gebaseerd zijn op bruikbare inzichten in plaats van op ruis of voor de hand liggende patronen.

Filtercriteria

De eerste stap bij het filteren van associatieregels is het instellen van minimale drempelwaarden voor support, confidence en lift. Deze statistieken helpen om regels te elimineren die te zeldzaam zijn om nuttig te zijn of die niet statistisch significant zijn.

  • Supportdrempel: negeer regels die in te weinig transacties voorkomen, omdat deze mogelijk uitschieters zijn of geen zakelijke impact hebben;
  • Confidencedrempel: verwijder regels die geen sterke associatie tonen tussen het antecedent en het consequent;
  • Liftdrempel: verwijder regels met liftwaarden dicht bij of onder de 1, omdat deze geen betekenisvolle associatie aangeven boven toeval.

Redundantie

Veel regels in de resultaten van de analyse kunnen redundant zijn, wat betekent dat ze geen nieuwe informatie bieden ten opzichte van andere regels. Bijvoorbeeld, als zowel "milk → bread" als "milk, butter → bread" vergelijkbare support en confidence hebben, voegt de specifiekere regel mogelijk geen waarde toe. Het identificeren en verwijderen van redundante regels helpt om te focussen op de meest beknopte en informatieve patronen.

Zakelijke relevantie

Niet alle statistisch sterke regels zijn bruikbaar voor het bedrijf. Om te bepalen of een regel bruikbaar is, stel de volgende vragen:

  • Suggereert de regel een productcombinatie die samen gepromoot kan worden?
  • Is de combinatie logistiek haalbaar (bijvoorbeeld geen combinatie van producten uit niet-gerelateerde afdelingen)?
  • Kan de regel de winkelindeling of cross-selling strategieën beïnvloeden?
  • Sluit de regel aan bij de bedrijfsdoelstellingen, zoals het vergroten van de winkelmand of het introduceren van nieuwe producten?

Voorbeeld: Regels filteren om waardevolle bundels te isoleren

Stel dat er een set associatieregels is gevonden uit transactiegegevens. Door drempelwaarden toe te passen en redundantie te verwijderen, kan een kleine set waardevolle productbundels worden geïsoleerd die zowel statistisch significant zijn als aansluiten bij de bedrijfsdoelstellingen.

12345678910111213141516171819202122232425262728293031
import pandas as pd # Example association rules DataFrame rules = pd.DataFrame({ 'antecedents': [['milk'], ['bread'], ['milk', 'bread'], ['chips'], ['chips', 'salsa']], 'consequents': [['bread'], ['milk'], ['butter'], ['salsa'], ['soft drinks']], 'support': [0.30, 0.28, 0.15, 0.10, 0.08], 'confidence': [0.7, 0.6, 0.5, 0.4, 0.75], 'lift': [1.2, 1.1, 0.95, 1.0, 1.5] }) # Setting filtering thresholds min_support = 0.10 min_confidence = 0.6 min_lift = 1.1 # Filtering rules by thresholds and explicitly creating a copy filtered_rules = rules[ (rules['support'] >= min_support) & (rules['confidence'] >= min_confidence) & (rules['lift'] >= min_lift) ].copy() # Removing redundant rules: keep only the most general (shortest antecedents) filtered_rules['antecedent_length'] = filtered_rules['antecedents'].apply(len) non_redundant_rules = filtered_rules.sort_values('antecedent_length').drop_duplicates('consequents') # Identifying top product bundles (by lift) top_bundles = non_redundant_rules.sort_values('lift', ascending=False) print(top_bundles[['antecedents', 'consequents', 'support', 'confidence', 'lift']])

1. Wat is de belangrijkste reden om een minimale lift-drempel in te stellen bij het filteren van associatieregels?

2. Welke van de volgende beschrijft het beste een redundante associatieregel?

question mark

Wat is de belangrijkste reden om een minimale lift-drempel in te stellen bij het filteren van associatieregels?

Selecteer het correcte antwoord

question mark

Welke van de volgende beschrijft het beste een redundante associatieregel?

Selecteer het correcte antwoord

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 4

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Sectie 2. Hoofdstuk 4
some-alt