
数事其术与变用
卷烟产品销售规律挖掘算法的应用
杨艳霞1张伟丰2
(1.武汉科技大学城市学院信息工程学部湖北武汉430083;
2.湖北汽车工业学院经济管理学院湖北十堰442002)
算法分析
摘要:为了利用券烟产品历史销售数据中落含的信息以制定更加合理的券烟产品营销策略,采用比较高效的关联规则FP一Growth算法设计了券炳产品销售决策支持系统,实残应用表明该系统能快违的发现不同时期卷券烟产品销售的关联关系,为营销人员及时掌握销售规律提供了有价值的参考。
关键词:FP-Growth算法关联规则数据挖据:频整模式
文章编号:1007-9416(2013)01-0121-01
中图分类号:TP311.13 1引言
文献标识码:A
2FP-Growth算法描述
目前,国家实行烟草专卖制度,每一地区的烟草公司实行统一的货源采购与分配,然后由零售客户产进行销售,卷烟产品的销售额和烟草公司的利润取决于合理的采购与分配计划,如何根据市场的变化,进行更合理的采购和分配,使利润最大化,将是一个急需要解决的问题。
烟草销售系统在运行过程中积累了大量的数据,利用数据挖掘技术来提取隐含在其中的、有用的重要信息,可以对卷烟产品的采购和销售提供决策支持。本文应用FP-Growth关联规则挖掘算法回来分析各个卷烟品种销售的关联关系,为各卷烟产品的分配和销售提供一定的决策依据。
表1客户订单转换事务表
订单名
T201251211 T201251212 T201251213 T201251214 T201251215 T201251216
下单产品名
11,12,17, 19,112, I21,-12,15,17, 16,19,
11,13,I6,19, 14, 123, 11,15,14,16,12,122,.. 121, 14, 18, 19, 115,125, 16, 21,117,19,113,126,
FP-Growth算法的核心是FP-Tree(频繁模式树)的构建,FP-Tree通过合并重复路径,减少了计算空闻的消耗,之后以树的通历操作代替了Apriori算法中最耗时的数据库扫描,从面大大提高了效率。
算法的具体过程描述如下:(1)通过扫描数据库得到频繁一项集以及各项支持度,按支持度降序排列构成频繁项目列表L。(2)再次扫描数据库,提取数据库各数据项中的频繁项并按频繁项目列表 L中的次序排序。(3)构造FP-Tree,首先创建树的根节点ull,接着对集合中每个频繁项:如果树有一个子节点N,则N节点计数加1 否则新建一个节点并令节点计数为1。(4)按频繁项目列表L的表尾到表头的顺序考察表中每一个项,在FP-Tree上找到所有包含此项的模式。(5)FP-Tree增长,对每一个频繁项的条件模式基,按照前述过程递归计算增长模式树,得到频繁模式的完全集。(6)由所有这些频繁项集生成满足最小支持度的关联规则。与Apriori算法相比, FP-Growth算法具有以下特点:不产生候选项集,只需扫描数据库两次,对于海量数据库,FP-Growth算法具有计算速度上的优势,能比较高效的找出频繁项集。
3用FP-Growth算法对订单信息进行关联规则提取
·下转第220页
表2某时间段客户订单关联规则挖掘结果
繁模式树FP-Trec
3-频索模式列
中红金龙(硬九州属龙》:9 申红金龙(强能器5mg):4 字红金龙(望星空):2
黄鹤楼(十八棵):1 黄鹤模(心履)12
聋醇档(十八程):1 中黄路型(尔多斯):2 L黄鹤楼(十八提):工红金龙(望星空):董的摄(鄂求多斯):1 黄路要(心婴):2
红金龙(望星空):2 一黄药楼(最尔多斯)
中-红金龙(硬楼5mg):5 黄妈要(尔多斯):2
一黄鹤楼(十八提):1 白置码型(心量):3
黄爵楼(十人提):2 红金龙(望星空》:1
白置醇楼(心需):1
(红金龙(望星室):1
既有的频整集,共13个
#建医民出(键九州阳龙)
楼
5mg)(6)
九州阳龙)便楼
全龙红全龙
频繁项集
(聚楼5mg)(4) 红全龙
(心幕)
震解楼
濮九州阳龙
黄鹤楼
(业量空)((
(魏九州题龙)
红全龙!
(心蒙)红全龙
(型星空
(饿九州限龙)黄鹤楼(邵年多新)
(键彩楼5mg)黄鹤楼(十八棵)(5)
红全龙
关联规则
黄(十人楼)红金龙(楼5mg)共有1条规则
作者简介:杨艳霞(1979-一),女,湖北式汉人,颈士,讲师,从事数据挖据与机器学习研究。