
第8期 2016年8月
组合机床与自动化加工技术
Modular Machine Tool & Automatic Manufacturing Technique
文章编号:10012265(2016)08003405
DOI:10. 13462/j. cnki. mmtamt. 2016.08. 010
电机状态异常数据检测算法研究
杨全纬,唐向红,郑阳,任甲举
(贵州大学现代制造技术教育部重点实验室,贵阳550003)
No.8 Aug.2016
摘要:针对电动机状态监测中异常数据检测存在的准确度低和测量值不精确等问题,文章提出一种基于区间数的不确定数据流异常检测算法。在该算法中,首先引入区间数的方法描述电动机状态监测中测量信号的不确定性,再利用区间数的位置关系对当前窗口的不确定数据进行剪枝,去除大多数正常的数据,最后根据距离值重新排列当前窗口的数据,收缩数据点的K-最近邻对象的查询范围。实验结果表明,该方法具有较高的检测精度和较低的计算复杂度,并能很好的运用到电动机状态监测中的异常数据检测。
关键词:电动机电流;不确定数据流;滑动口;K-距离;异常数据检测
中图分类号:TH39;TG506
文献标识码:A
The Outlier Data Detection Algorithm in the Control System of Motor
YANG Quan-wei,TANG Xiang-hong,ZHENG Yang,REN Jia-ju
(Key Laboratory of Advanced Manufacturing Technology, Ministry of Education, Guizhou University, Guiyang 550003,China)
Abstract: Aiming at the inaccuracy of outlier data and measured data in the control system of motor, an out lier detection algorithm based on interval data was proposed in uncertain data stream. In this algorithm, first-ea the sliding windows was pruned by the position between two interval data, to dislodge most of the normal data; Finally, the current window data based on their distance with the first data was reordered, to reduce query data in k-close distance, Experiment results showed that the algorithm not only possessed better cluste-ring precision with low computing complexity but also applied to outlier data detection in the motor monito-ring system well.
Key words: motor current; uncertain data stream; sliding window; K-close distance; date detection
0引言
目前,电机状态检测的采集信号主要是利用传感器将包含故障特征的信号转换成数字仪器可直接测量的电气信号1]。其特征不仅是数据到达速度极快、规模庞大[2-3],而且在实际系统中由于测试对象失效、测试仪器自身误差和高磁场干扰等问题引起了其具有不确定性,并且它已逐渐成为影响测试信息可信性和系统可靠性的主要因素之一[3]。因此,面向电机状态检测系统中不确定数据流分析与挖掘技术的研究,对克服数据的不准确性和保证更高的检测精度具有非常重要的意义。
在不确定数据挖掘的研究领域中,异常点检测是其重要的研究内容之一,同时是数据挖掘处理过程的第1
步[6)。一方面它对检测到的异常数据进行分析,能获取许多重要的信息"];另一方面它对剔除的正常数据进行分析,可以得到更为准确的分析结果(")。迄今为止,研究人员关于不确定数据异常点检测的研究还很少。其中,Aggarwal和Yul"提出基于遍历子空间和密度估计的不确定数据离群点检测算法。该算法对不确定数据对象在一个密集区域出现的概率使用平概率进行量化,再设定特定阅值判定离群点,避免了在处理多维不确定数据过程中对不是离群点的对象进行误判。文献[10] 提出基于距离的不确定离群点检测的算法,该算法虽减少了检测次数,提高了效率,但在非均匀数据集的检测过程中精度不高,并只适合概率数据流的异常检测。姜元凯等人[]提出基于密度的不确定数据离群检测算法。该算法采用R2-tree结构,虽能有效降低了时间复
收稿日期:2015-08-23;修回日期:2015-08-28
·基金项目:国家科技支撑计划(2012BAF12B14):贵州省重大科技专项(黔科合重大专项字(2012)6018);贵州省科学技术基金项目(龄科合」字
(((
作者简介:杨全纬(1989一),男,期北荆门人,贵州大学硕士研究生,研究方向为先进制造技术、自动控制,(E-mail)825537796@qq:com;
@163.com
万方数据