Filtrado de reglas sin sentido e identificación de paquetes de productos de alto valor
Desliza para mostrar el menú
Para maximizar el impacto del análisis de canasta de mercado, es necesario separar las reglas de asociación realmente valiosas de aquellas que son triviales o irrelevantes para los objetivos empresariales. Este proceso garantiza que las recomendaciones y promociones se basen en conocimientos accionables y no en ruido o patrones evidentes.
Criterios de filtrado
El primer paso para filtrar reglas de asociación es establecer umbrales mínimos para soporte, confianza y lift. Estas métricas ayudan a eliminar reglas que son demasiado raras para ser útiles o que no son estadísticamente significativas.
- Umbral de soporte: ignorar reglas que aparecen en muy pocas transacciones, ya que pueden ser valores atípicos o carecer de impacto comercial;
- Umbral de confianza: descartar reglas que no muestran una asociación lo suficientemente fuerte entre el antecedente y el consecuente;
- Umbral de lift: eliminar reglas con valores de lift cercanos o inferiores a 1, ya que no indican una asociación significativa más allá del azar.
Redundancia
Muchas reglas en los resultados del análisis pueden ser redundantes, es decir, no aportan información nueva en comparación con otras reglas. Por ejemplo, si tanto "milk → bread" como "milk, butter → bread" tienen soporte y confianza similares, la regla más específica puede no aportar valor. Identificar y eliminar reglas redundantes ayuda a centrarse en los patrones más concisos e informativos.
Relevancia empresarial
No todas las reglas estadísticamente fuertes son útiles para el negocio. Para determinar si una regla es accionable, considere:
- ¿Sugiere la regla una combinación de productos que se pueda promocionar conjuntamente?
- ¿Es la combinación logísticamente viable (por ejemplo, no agrupar productos de departamentos no relacionados)?
- ¿Puede la regla informar sobre la disposición de la tienda o estrategias de venta cruzada?
- ¿La regla se alinea con los objetivos empresariales, como aumentar el tamaño de la canasta o introducir nuevos productos?
Ejemplo: Filtrado de reglas para aislar paquetes de alto valor
Suponga que ha extraído un conjunto de reglas de asociación de los datos de transacciones. Al aplicar umbrales y eliminar redundancias, puede aislar un pequeño conjunto de paquetes de productos de alto valor que sean estadísticamente significativos y estén alineados con los objetivos empresariales.
12345678910111213141516171819202122232425262728293031import pandas as pd # Example association rules DataFrame rules = pd.DataFrame({ 'antecedents': [['milk'], ['bread'], ['milk', 'bread'], ['chips'], ['chips', 'salsa']], 'consequents': [['bread'], ['milk'], ['butter'], ['salsa'], ['soft drinks']], 'support': [0.30, 0.28, 0.15, 0.10, 0.08], 'confidence': [0.7, 0.6, 0.5, 0.4, 0.75], 'lift': [1.2, 1.1, 0.95, 1.0, 1.5] }) # Setting filtering thresholds min_support = 0.10 min_confidence = 0.6 min_lift = 1.1 # Filtering rules by thresholds and explicitly creating a copy filtered_rules = rules[ (rules['support'] >= min_support) & (rules['confidence'] >= min_confidence) & (rules['lift'] >= min_lift) ].copy() # Removing redundant rules: keep only the most general (shortest antecedents) filtered_rules['antecedent_length'] = filtered_rules['antecedents'].apply(len) non_redundant_rules = filtered_rules.sort_values('antecedent_length').drop_duplicates('consequents') # Identifying top product bundles (by lift) top_bundles = non_redundant_rules.sort_values('lift', ascending=False) print(top_bundles[['antecedents', 'consequents', 'support', 'confidence', 'lift']])
1. ¿Cuál es la razón principal para establecer un umbral mínimo de lift al filtrar reglas de asociación?
2. ¿Cuál de las siguientes opciones describe mejor una regla de asociación redundante?
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla