Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Merkityksettömien Sääntöjen Suodatus ja Korkean Arvon Tuotekokonaisuuksien Tunnistaminen | Suorituskykyinen Sääntöjen Louhinta ja Skaalauksen Optimointi
Market Basket -analyysi ja suositusjärjestelmät

Merkityksettömien Sääntöjen Suodatus ja Korkean Arvon Tuotekokonaisuuksien Tunnistaminen

Pyyhkäise näyttääksesi valikon

Jotta markkinakori-analyysin vaikutus maksimoidaan, on eroteltava aidosti arvokkaat assosiaatiosäännöt niistä, jotka ovat joko triviaaleja tai eivät liity liiketoiminnan tavoitteisiin. Tämä prosessi varmistaa, että suositukset ja kampanjat perustuvat toteuttamiskelpoisiin oivalluksiin eivätkä kohinaan tai ilmeisiin kuvioihin.

Suodatuskriteerit

Ensimmäinen vaihe assosiaatiosääntöjen suodatuksessa on asettaa vähimmäiskynnykset tuelle (support), varmuudelle (confidence) ja nosteelle (lift). Näiden mittareiden avulla voidaan poistaa säännöt, jotka ovat liian harvinaisia ollakseen hyödyllisiä tai eivät ole tilastollisesti merkittäviä.

  • Tukikynnys: jätä huomiotta säännöt, joita esiintyy liian harvoin tapahtumissa, sillä ne voivat olla poikkeamia tai vailla liiketoiminnallista merkitystä;
  • Varmuuskynnys: poista säännöt, jotka eivät osoita riittävän vahvaa yhteyttä edeltäjän ja seuraajan välillä;
  • Nostekynnys: poista säännöt, joiden nostearvo on lähellä yhtä tai sen alapuolella, sillä ne eivät osoita merkittävää yhteyttä satunnaisuuden lisäksi.

Redundanssi

Monet louhinnan tuloksena saadut säännöt voivat olla redundantteja, eli ne eivät tarjoa uutta tietoa verrattuna muihin sääntöihin. Esimerkiksi, jos sekä "milk → bread" että "milk, butter → bread" omaavat samanlaisen tuen ja varmuuden, tarkempi sääntö ei välttämättä tuo lisäarvoa. Redundanttien sääntöjen tunnistaminen ja poistaminen auttaa keskittymään ytimekkäimpiin ja informatiivisimpiin kuvioihin.

Liiketoiminnallinen merkityksellisyys

Kaikki tilastollisesti vahvat säännöt eivät ole hyödyllisiä liiketoiminnalle. Arvioidaksesi, onko sääntö toteuttamiskelpoinen, kysy:

  • Ehdottaako sääntö tuoteparia, jota voidaan markkinoida yhdessä?
  • Onko yhdistelmä logistisesti mahdollinen (esim. ei yhdistetä tuotteita eri osastoilta)?
  • Voiko sääntö ohjata myymälän layoutia tai ristiinmyyntistrategioita?
  • Tukeeko sääntö liiketoiminnan tavoitteita, kuten ostoskorin koon kasvattamista tai uusien tuotteiden esittelyä?

Esimerkki: Sääntöjen suodatus arvokkaiden tuotenippujen tunnistamiseksi

Oletetaan, että olet louhinut joukon assosiaatiosääntöjä tapahtumatiedoistasi. Soveltamalla kynnysarvoja ja poistamalla redundanssia voit eristää pienen joukon arvokkaita tuotenippuja, jotka ovat sekä tilastollisesti merkittäviä että tukevat liiketoimintatavoitteitasi.

12345678910111213141516171819202122232425262728293031
import pandas as pd # Example association rules DataFrame rules = pd.DataFrame({ 'antecedents': [['milk'], ['bread'], ['milk', 'bread'], ['chips'], ['chips', 'salsa']], 'consequents': [['bread'], ['milk'], ['butter'], ['salsa'], ['soft drinks']], 'support': [0.30, 0.28, 0.15, 0.10, 0.08], 'confidence': [0.7, 0.6, 0.5, 0.4, 0.75], 'lift': [1.2, 1.1, 0.95, 1.0, 1.5] }) # Setting filtering thresholds min_support = 0.10 min_confidence = 0.6 min_lift = 1.1 # Filtering rules by thresholds and explicitly creating a copy filtered_rules = rules[ (rules['support'] >= min_support) & (rules['confidence'] >= min_confidence) & (rules['lift'] >= min_lift) ].copy() # Removing redundant rules: keep only the most general (shortest antecedents) filtered_rules['antecedent_length'] = filtered_rules['antecedents'].apply(len) non_redundant_rules = filtered_rules.sort_values('antecedent_length').drop_duplicates('consequents') # Identifying top product bundles (by lift) top_bundles = non_redundant_rules.sort_values('lift', ascending=False) print(top_bundles[['antecedents', 'consequents', 'support', 'confidence', 'lift']])

1. Mikä on tärkein syy asettaa vähimmäisnostekynnys assosiaatiosääntöjä suodatettaessa?

2. Mikä seuraavista kuvaa parhaiten redundanttia assosiaatiosääntöä?

question mark

Mikä on tärkein syy asettaa vähimmäisnostekynnys assosiaatiosääntöjä suodatettaessa?

Valitse oikea vastaus

question mark

Mikä seuraavista kuvaa parhaiten redundanttia assosiaatiosääntöä?

Valitse oikea vastaus

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 4

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Osio 2. Luku 4
some-alt