Merkityksettömien Sääntöjen Suodatus ja Korkean Arvon Tuotekokonaisuuksien Tunnistaminen
Pyyhkäise näyttääksesi valikon
Jotta markkinakori-analyysin vaikutus maksimoidaan, on eroteltava aidosti arvokkaat assosiaatiosäännöt niistä, jotka ovat joko triviaaleja tai eivät liity liiketoiminnan tavoitteisiin. Tämä prosessi varmistaa, että suositukset ja kampanjat perustuvat toteuttamiskelpoisiin oivalluksiin eivätkä kohinaan tai ilmeisiin kuvioihin.
Suodatuskriteerit
Ensimmäinen vaihe assosiaatiosääntöjen suodatuksessa on asettaa vähimmäiskynnykset tuelle (support), varmuudelle (confidence) ja nosteelle (lift). Näiden mittareiden avulla voidaan poistaa säännöt, jotka ovat liian harvinaisia ollakseen hyödyllisiä tai eivät ole tilastollisesti merkittäviä.
- Tukikynnys: jätä huomiotta säännöt, joita esiintyy liian harvoin tapahtumissa, sillä ne voivat olla poikkeamia tai vailla liiketoiminnallista merkitystä;
- Varmuuskynnys: poista säännöt, jotka eivät osoita riittävän vahvaa yhteyttä edeltäjän ja seuraajan välillä;
- Nostekynnys: poista säännöt, joiden nostearvo on lähellä yhtä tai sen alapuolella, sillä ne eivät osoita merkittävää yhteyttä satunnaisuuden lisäksi.
Redundanssi
Monet louhinnan tuloksena saadut säännöt voivat olla redundantteja, eli ne eivät tarjoa uutta tietoa verrattuna muihin sääntöihin. Esimerkiksi, jos sekä "milk → bread" että "milk, butter → bread" omaavat samanlaisen tuen ja varmuuden, tarkempi sääntö ei välttämättä tuo lisäarvoa. Redundanttien sääntöjen tunnistaminen ja poistaminen auttaa keskittymään ytimekkäimpiin ja informatiivisimpiin kuvioihin.
Liiketoiminnallinen merkityksellisyys
Kaikki tilastollisesti vahvat säännöt eivät ole hyödyllisiä liiketoiminnalle. Arvioidaksesi, onko sääntö toteuttamiskelpoinen, kysy:
- Ehdottaako sääntö tuoteparia, jota voidaan markkinoida yhdessä?
- Onko yhdistelmä logistisesti mahdollinen (esim. ei yhdistetä tuotteita eri osastoilta)?
- Voiko sääntö ohjata myymälän layoutia tai ristiinmyyntistrategioita?
- Tukeeko sääntö liiketoiminnan tavoitteita, kuten ostoskorin koon kasvattamista tai uusien tuotteiden esittelyä?
Esimerkki: Sääntöjen suodatus arvokkaiden tuotenippujen tunnistamiseksi
Oletetaan, että olet louhinut joukon assosiaatiosääntöjä tapahtumatiedoistasi. Soveltamalla kynnysarvoja ja poistamalla redundanssia voit eristää pienen joukon arvokkaita tuotenippuja, jotka ovat sekä tilastollisesti merkittäviä että tukevat liiketoimintatavoitteitasi.
12345678910111213141516171819202122232425262728293031import pandas as pd # Example association rules DataFrame rules = pd.DataFrame({ 'antecedents': [['milk'], ['bread'], ['milk', 'bread'], ['chips'], ['chips', 'salsa']], 'consequents': [['bread'], ['milk'], ['butter'], ['salsa'], ['soft drinks']], 'support': [0.30, 0.28, 0.15, 0.10, 0.08], 'confidence': [0.7, 0.6, 0.5, 0.4, 0.75], 'lift': [1.2, 1.1, 0.95, 1.0, 1.5] }) # Setting filtering thresholds min_support = 0.10 min_confidence = 0.6 min_lift = 1.1 # Filtering rules by thresholds and explicitly creating a copy filtered_rules = rules[ (rules['support'] >= min_support) & (rules['confidence'] >= min_confidence) & (rules['lift'] >= min_lift) ].copy() # Removing redundant rules: keep only the most general (shortest antecedents) filtered_rules['antecedent_length'] = filtered_rules['antecedents'].apply(len) non_redundant_rules = filtered_rules.sort_values('antecedent_length').drop_duplicates('consequents') # Identifying top product bundles (by lift) top_bundles = non_redundant_rules.sort_values('lift', ascending=False) print(top_bundles[['antecedents', 'consequents', 'support', 'confidence', 'lift']])
1. Mikä on tärkein syy asettaa vähimmäisnostekynnys assosiaatiosääntöjä suodatettaessa?
2. Mikä seuraavista kuvaa parhaiten redundanttia assosiaatiosääntöä?
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme