Forståelse af mekanismerne bag market basket-matricen
Stryg for at vise menuen
En market basket-matrix er en struktureret måde at repræsentere detailtransaktioner på til analyseformål. I denne matrix svarer hver række til en unik transaktion (såsom et kundekøb ved kassen), og hver kolonne repræsenterer en specifik vare til salg. Matrixens indgange bruger binær kodning: en værdi på 1 betyder, at varen blev købt i den pågældende transaktion, mens 0 betyder, at den ikke blev købt.
En market basket-matrix er en struktureret tabel, der repræsenterer transaktionsdata i detailanalyse. Hver række står for en enkelt transaktion (såsom en kundes indkøbskurv), og hver kolonne repræsenterer et specifikt produkt eller en vare tilgængelig i butikken. Skæringspunktet mellem en række og en kolonne indeholder en værdi—typisk 1 eller 0—der angiver, om varen blev købt i den pågældende transaktion.
Denne struktur er grundlæggende for association rule mining, fordi den giver et klart, kvantitativt overblik over, hvilke varer der købes sammen på tværs af mange transaktioner. Ved at analysere mønstre i denne matrix kan man afdække associationer, såsom at identificere produkter, der ofte købes sammen, eller opdage hvilke varer der øger salget, når de pakkes sammen.
For at forstå, hvordan dette fungerer, kan man overveje et lille sæt eksempler på transaktioner:
- Transaction 1: Bread, Milk;
- Transaction 2: Bread, Diaper, Beer, Eggs;
- Transaction 3: Milk, Diaper, Beer, Cola;
- Transaction 4: Bread, Milk, Diaper, Beer;
- Transaction 5: Bread, Milk, Diaper, Cola.
Først listes alle unikke varer: Bread, Milk, Diaper, Beer, Eggs, Cola. Derefter oprettes matrixen ved at markere 1, hvis en vare optræder i en transaktion, og 0 ellers. Resultatet er en tabel, hvor hver række er en transaktion og hver kolonne er en vare, udfyldt med binære værdier for at angive køb.
Denne matrix er udgangspunktet for algoritmer, der søger efter hyppige varesæt og genererer associationsregler, hvilket gør den til en hjørnesten i detailanalyse.
Eksempel: Opbygning af en Market Basket Matrix i Python
Følgende Python-kodeeksempel demonstrerer, hvordan man konstruerer en market basket matrix ud fra transaktionsdata:
- En liste kaldet
transactionsdefinerer hver indkøbskurv som en liste over varer købt sammen; - Alle unikke varer på tværs af hver transaktion samles og sorteres i listen
items; - Koden gennemløber hver transaktion og opretter en række af binære værdier:
1hvis en vare er til stede i transaktionen,0hvis ikke; - Disse rækker kombineres til en matrix, som derefter konverteres til en pandas DataFrame ved hjælp af
pd.DataFrame.
1234567891011121314151617181920212223import pandas as pd # Sample list of transactions (each transaction is a list of items) transactions = [ ['Bread', 'Milk'], ['Bread', 'Diaper', 'Beer', 'Eggs'], ['Milk', 'Diaper', 'Beer', 'Cola'], ['Bread', 'Milk', 'Diaper', 'Beer'], ['Bread', 'Milk', 'Diaper', 'Cola'] ] # Get a sorted list of all unique items items = sorted({item for transaction in transactions for item in transaction}) # Create the market basket matrix basket_matrix = [] for transaction in transactions: row = [1 if item in transaction else 0 for item in items] basket_matrix.append(row) # Convert to pandas DataFrame for readability df = pd.DataFrame(basket_matrix, columns=items) print(df)
Denne DataFrame giver en klar, læsbar tabel, hvor hver række repræsenterer en transaktion, og hver kolonne repræsenterer et produkt. Du kan nemt se, hvilke varer der købes sammen, ved at kigge efter 1-taller i samme række, hvilket gør det enkelt at analysere vareassociationer.
1. Hvilket af følgende beskriver bedst formålet med en market basket matrix i detailanalyse?
2. I en market basket-matrix, hvad repræsenterer rækker og kolonner typisk?
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat