您当前的位置:首页>论文资料>数据挖掘中Apriori算法在零售业中的应用

数据挖掘中Apriori算法在零售业中的应用

资料类别:论文资料

文档格式:PDF电子版

文件大小:2.1 MB

资料语言:中文

更新时间:2024-12-20 15:42:32



推荐标签:

内容简介

数据挖掘中Apriori算法在零售业中的应用 数字热本与变用
算法分析
数据挖掘中Apriori算法在零售业中的应用
刘勇
(重庆广播电视大学重庆400039)
摘要:随着网络时代的飞速发展,我们天部要接融到大量数据信息,与其说我们生活在信息时代,不如说我们生活在数据时代。来自商业与社会、科学和工程,以及我们日常生活的方方面面的数兆宇节或是干兆宇节的数据注入我们的计算机网络、万维网和各种数据存储设备,世界范围的销售事务、股票交易记录、公司利润和业绩以及顾问反馈等商业活动产生的互大的数据集正至现几何级增加、爆炸式增长。如何合理使用并有效分析要数据,如何在零售业中采用Apriori算法进行数据挖据,正是本文要讨论的内容。
关键词:数据挖据Apriori算法零售业
中图分类号:TP311.13
1数据挖据的定义以及工作方式
文献标识码:A
文章编号:1007-9416(2014)04-0139-0)
到预期目标后重新回到前面的步骤,重新调整并重新执行,例如在
数据挖据(datamining)是指对于那些潜在的、有用的信息和知识进行分析提取,从大量数据中寻找其规律的技术。这些信息和知识的特点是大量性、不完全性、噪声性、模糊性和随机性。
数据挖掘主要有数据准备、规律寻找和规律表示三个步骤。从数据本身来进行分类,它通常是由信息收集、数据集成、数据规约、数据清理,数据变换.数据挖揭实施过程和模式评估等7个步骤来构成的,下面详细进行叙述。
(1)信息收集:这个步骤是通过从确定的数据分析对象中来提取具有抽象性的数据并进行分析来获取一些特征信息,并以合适的信息收集方法来存储到相应的数据库这对于大量存在的数据来说是非常重要的。(2)数据集成;这个步骤是通过将来源不同、格式不同、特点性质不同的各种数据在逻辑上或物理上进行分类集中,其自的量实现合业中的数据共享等,数据规约,这不步服量特针对
执行多数的数据进行挖掘算法,也就是说即使在少量数据
大量的时间,那
上他需
,商业运营数据授据干作听盖要的数据量量非营
巨大的。数据规约技术则可以用来以数据集的规约表示的方式
作,它就相对来
规约后执相同的优
不完整的(有
性值),不
但是其最
致的同样的信息
标是处理后的完整性、正确性和
很喜,精后或
对在数据库中的数据存在
(包含错误的质效据的清理,其目
并最终被存人到数据仓库
之中。否则,挖据的结果会不尽如人意。(5数据变换:这个步赚是实现将数据转换成适用于数据挖掘的形式,其中的工作方法是平滑聚集,数据概化,规范化等方式。而通过使用概念分层和数据的离散化
来转换数据也是实数数据处理中的重要
步。(6)数据挖据掘过程:这
个步骤的目的是得到有用的分析信息。它的工作原理是根据数据仓库中的数据信息来选择合适的分析工具、应用统计方法例如:事例推理、决策树、规则推理、模翻集、甚至神经网络、遗传算法等)各种方法处理信息实现的。(7)模式评估:这个步骤的实现目标是验证数据挖掘的正确性,这是由行业专家来执行的,也是以从商业角度来进行的。
数据挖据过程需要不断反复和循环,它会在每一个步赚没有达
数据库
建立位图矩阵
数据挖据功能 Aprior送联算法关联规则
图1Aprior算法应用结构图
某个工作中不存在多个数据源的时候,那么步骤(2)数据集成的步骤使可以省略。
2Apriori算法在零售业中的应用
零售业是非常适合进行数据挖掘的应用领域,它有着关系销售、顾客的购物史、货物运输、商品消费和服务等大量数据。尤其是在当今基于Web或电字商务上进行的商业活动更加便捷流行的背景下,可供分析收集的数据量日益快速膨胀。今天大部分有一定规模的连锁店都会有自已的网站或是电商平台,顾客们在联机状况下都可以方便购买商品,基至不需实体商场而只有线上商店。零售业的这些发展特征以及海量的零售关系数据均为数据挖掘提供了丰高的数据资源和样本数据来源。
关联规则挖据是数据挖掘重要技术之一,面Apriori算法是关联规则挖掘中的一种经典算法,也称为挖据关联规则的频繁项集算法。该关联规则在分类上属于单维、单层、布尔关联规则,在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。Apriori 算法使用逐层搜索的送代方法来进行工作,其中的K项集用于(K+1)项集。首先,通过扫描数据库,累计每个项的计数,并收集满足最小支持度的项,找出频繁1项集的集合,该集合记为L1。然后使用 L1找出赖繁L2,使用L2找出L3,反复如此,一直到频繁的K项集不能被找到这个时候,那么,再找出每个LK需要一次数据库的完整扫描
根据Apriori算法的原理,我们可以按照以下四个步骤将 Apriori算法应用到零售业中的某个具体研究对象:(1)确定研究(挖掘)的目标对象,(2)关联目标对象的数据整理、收集(预处理)如采用位图矩阵等技术手段优化数据存储),(3)用Apriori算法找出与研究数据相关联的、相关性的频繁项集;(4)产生(设置)关联规则并进行最终解释(优化)。图1为ADriori算法应用结构医
数据挖掘技术在现代社会各个应用领域中均得到了广泛的应用和发展,各类成功的应用实践和范例也层出不穷。从最初的购物蓝分析到现在决策分析和商务管理中海量数据间依存的关系挖据,关联规则发现,需要大量使用到数据挖掘,处理技术。Aproiri做为数据挖掘中常用的经典算法之一,针对不同的数据处理对象、不同的数据处理要求和不同的时间约束,也紧随时代和技术的发展,不
断的进行着改进和演化。参考文献
[1]杨录强.基于数据挖掘的计算机审计方法研究文就述评[J].中外企业家,2012(10)
[2]普势胜,彭灿明,陈源,张新林.基于数据挖掘的审计系统研究[J]。长春工程学院学报(自热科学版),2011(01).
[3]宋中山.挖掘大型数据库中的Apriori算法及其改进[J].中南民族大学学报(自然科学版),2003年01期
[4]牛丽敏.Apriori算法分析与改进综述[J].桂林电子科技大学学报. 2007(01).
作者简介:对勇(1974一),重庆荣昌人,讲师,主要从事数据库技术、教育信息技术应用研究,
39
上一章:动态网站建设与研究应用 下一章:校园超市中数据挖掘技术的应用

相关文章

基于Apriori算法的数据挖掘在移动医疗终端系统中的研究 机器学习算法在数据挖掘中的应用 探讨数据挖掘算法在入侵检测中的应用 浅析数据挖掘算法在入侵检测中的应用 数据挖掘算法与应用——在足球比赛角球进攻战术研究中的应用 加权挖掘算法在智慧 旅游景点推荐系统中的应用分析 插值算法在图像复原中的应用 进化算法及其在生物信息中的应用