
学术论坛
数字执本开与或用
WSN网络中一种新的关联规则数据挖掘算法
罗启涵周林罗铮温鑫
(重庆邮电大学通信软件技术研究所重庆400065)
摘要:在无线传感器网络(WSN)中,传感器关联规则在很多方面有看重要作用。但是大部分关联规则的数据挖据算法部要求获取传感器节点的行为数据。同时,将达数据传输到ink节点,并且由sink节点创建传感器数据库,并应用不同的算法从传感器数据库来发现关联规则。本文则提出了一个网络内部机制来查我频繁项集。国此,节点只发送传感器频繁模式到sink节点,而不是节点整个活动集,从而节省sink节点开销,
关键词:传感器网络关联规则数据挖抵
文献标识码:A
中图分类号:TP311.3
文章编号:1007-9416(2013)11-0192-02
Abstract:Sensor association rules have been found to be very usefil with many important applications in wireless sensor networks (WSN). However, most data mining algorithms of association rules are required to obtain the behavior of the sensor node dhta. Meanwhile, transfer the data to the sink node. And then, the sink node creates the sensor database and applies diferent algorithms to find association rules from the sensor databuse, In this paper, we propose an innetwork mechanism to find frequent sensor pattems in the sensors themselves. So, the sensors send only the frequent senor patterns to the sink, not the sensor activity sets. It leads to smaller overhead on sink nodes
Key Words:Sensor networks, Association rules, Data mining.
1引言
无线传感器网络(WSN)在军事、农业、天气预报、以及森林火灾监测等领域都有着广泛的应用。而近年来,数据挖掘技术对提取描述传感器和网络行为模式的作用越来越重要,它可以被用来改善网络的性能和QoS。在各种数据挖掘技术中,关联规则,也称传感器关联规则,已被广泛用于无线传感器网络5o)
对于应用数据挖掘技术,尤其是对传感器数据的关联规则挖掘技术已有一些研究。L0o等人国首先通过使用节点数据模型和在线 one-pass数据,来对关联规则数据挖揭进行研究。文献(中对从传感器节点接收到的数据流提出了数据流关联规则挖掘框架(DSARM)。这个框架是基于Apriori算法。在传感器网络中,Boukerche等人"提出了另一种新的关联规则挖掘算法。在此基础上,本文提出了一个高效的数据挖掘算法用于使用PLT(Positional Lexicographic Tree) 生成的传感器行为模式。它是一个用来存储传感器行为数据的新的代表性数据结构。
通常,WSN网络中sink节点从每一个传感器收集活动集合或行为数据并创建传感器数据库。然后,自本sink节点的传感器数据库提取关联规则。这个过程需要大量传感器和sink节点之间的消息传递。本文中提出了一种机制来计算传感器本身的频繁传感器模型。所以,传感器将随着对sink支持计数发送频繁的传感器模式。从面减少
了sink节点的开销。 2传感器关联规则
关联规则挖掘是一个重要的数据挖掘技术,并广泛应用于各个领域(23)。然而,传感器关联规则挖掘从文献(中讨论的关联规则作了。
首先,设S=s,,5.5,,"".5,1为该传感器网络中的传感器集合。让时间分成相等的大小的时隙t,,t,,",,t,使得t。t,=入,其中入是每个时隙的大小。T±=t。一t,为数据的历史周期,即数据提取过程
表1
Epoch SrSSs
2 3
sss SSt
基金项目:国家自然科学基金项目(项目批准号:61171190
的时间。一组传感器P=[5,,5,5,,",,5,]称为一个模式的传感器。一个周期(Epoch)定义为一组E=(E,,P),表示在P模式中所有传感器在相同的时障E_检测到该事件。同时,一个传感器数据库DS(也称为行为数据)被定义为一组这样周期(Epoch)见表1)。若P,CP,一个周期E=(E,P)表示支持模式P,在DS中的P,模式的频率是在DS中支持P,的周期数量。P,和P,两个模式之间传感器关联规则表示为P一 P,.其中P,,P,CS和P.nP=。规则是由频率支撑,置信度的计算公
式为额率(P,UP,)/频率(P,)。 3改进机制
假设无线传感器网络包含一组传感器节点S=(s,S,,5, s,也假设传感器id是字典序,也就是5
在周期结束时,每个传感器将创建和存储它的活动集合,并计算其频率或支持计数。假设sink节点已经广播了参数,如最小支持度和最小置信度。然后,采用多跳协议,将各频繁的传感器(传感器的支持数超过最低支持数的和支持数发送其他传感器。现在,每一个频繁传感器将维护一个升序排列的频繁传感器列表,它以更高的id 开始。例如,频繁传感器5,的集合看起来像(s,5,,5,l。然后,每一个频繁传感器与频繁传感器列表中的传感器进行通信,找到频繁传感器模式并将其储存。为了进一步优化,最后一个频繁传感器将启动这个过程。如有需要,每一个频繁的传感器也可以存储共同的时隙集合和相应的频率来为每一个频繁模式增加效率。最后,每一个频繁的传感器将频繁传感器模式发送到sink节点。
在传感器中使用一些修剪技术和适当的数据结构存储频繁传感器模式将使算法效率在很大程度上得到提高,当与其他更高级的
作者篇介:罗启满(1988一):男(汉),重庆,硕士应届生,主要研究方向:数据挖据、物联网。
周林(1970一),男,重庆,制教投,研究方向:物联网新技术研究,数据挖据,
罗静(1988-),男,重庆,硕士应局生,研究方向:物联网新技术研究温鑫(1988-),男,重庆,硕士应局生,研究方向:物联网新技术研究。
92