
数事我本方选用
校园超市中数据挖掘技术的应用
江波
(吉林化工学院信息与控制工程学院,吉林吉林132022)
应用研究
摘要:本文从数据挖据技术理论在校国企业中的研究着手,对数据挖据技术在校园超市管理系统中的有效应用进行研完分析关键词:数据挖掘技术;关联规则算法;校国超市
中图分类号:TP311.13
1数据挖掘在校园超市中的应用价值
文献标识码:A
校超市中累积了大量的数据,为数据挖掘工作的顺利进行提供了前提条件,所以考在超市中使用数据挖掘技术。面创建超市的目的自然是为了通过校园超市能够赚到更多的钱,所以从主观意义上也希望可以实现对数据进行挖掘,从现实数据中获得有价值的
信息来创造财富"。 2数据采集方法
对数据挖掘这一技术在校园超市企业中是怎样工作的进行探讨,就是通过校园超市目常性记录数据进行分析和挖掘,从而对数
表1关联事务表
货物!毛巾手机 T恤
顾客 A B 5
顾客ID 锡油膏A 内衣B 洗面奶C 沐溶露D
货物2 杂志内衣牙膏
类别
货物3 卫生纸
饼干洗化类 60 10 0
204720542055
0
0
透明皂E1
0
1 0
2059
1-
0
货物4 手机
货物5
文章编号:1007-9416(2017)10-0085-02
据挖掘的作用有了更好的理解。数据挖掘技术从字面上理解,一定离不开数据,使用什么样的办法来获得数据就是数据采集帮助我们解决的问题。一种办法,是使用取样方法挑选人们需要的数据,另一种办法,是借助虚拟表来挑选需要的数据。在表1关联事务表和表 2决策事务表中分别利用单张收据小票数据和某日的多张收据小票
中数据为相关分析提供数据。 3原始数据采集
已知集合L中包含的数据为校园超市所出售的货物,这些货物间具备一些隐含的购买规律。寻找以往顾客在校园超市的购物信息,筛选出具有集合中货物的数据,制成表3所示,使用数字1和0分别表示顾客是否买人了相应货物。L=焗油膏A,内衣B、洗面奶C、沐浴露D、透明皂E。
借用上面表格的内容,通过货物相关的事物数量占所有事物数量的比值,参照Apriori算法思想,获得支持度,继而分析超市货物间潜在的购物联系。按照Apriori算法,利用表3数据计算支持度Sup
port(图1)。
表2决策事务表
服装类
0 70 40
20602065 0
1 1 0
1 1 0
Support (A) - 12/20 - 60%
(B) = 17/20 = 85%
Support
= 17/20 85%(C)
Support
= 6/20 = 30%(D)
Support
2084
0-0 0
书刊类
10 0 20. ,
表3销售数据处理后
电器类 1500 2 200 0
食品类
0 0 20.
20852096
2097
2098
2108
2112
2115
2171
12131
0
1 o 0 1
1 0 0
Support Support Support Support
= 4/20 = 20%
Support
(E)
Support(AB)=9/20= 45% Support
(AC)
= 10/20 = 50% = 3/20 = 15%
Supart
(AD)
Support (AE)
= 2/20 = 10%
收稿日期:2017-10-20
Support Support Support Support Support
1 0 1 0
1 0
0 1 1 0 0
= 14/20 = 70%(BC)
5/20 = 25%(BD)
(BE)
= 4/20 = 20%
= 4/20 = 20%(CD)
(CE)
= 3/20 = 15%
= 1/20 = 5%(DE)
(ABC) = 6/20 = 30%
= 2/20 = 10%
(AND)(ABE)
= 1/20 = 5% 图1
1 1 0 1
0
Support Support Support Support Support Support Support Supprt
作者简介:江波(1980一),女,吉林吉林人,颈士,讲师,研究方向:模式识别与智能系统研究。万方数据
1 1 1 0 0
1 1 0 0
2176
1 0
利润高高低.
2181
1 0
= 2/20 = 10%(ACD)
- 1/20 - 5%
(ACE)
(BCD)(BCE)(BDE)(CDE)
= 3/20 = 15% = 3/20 = 15% = 1/20 = 5% = 1/20 = 5%
(ABCD)(ATCE)
= 1/20 = 5% = 1/20 = 5%
21822183
0 1
0
0 1 1 0 0
8