
2011年第1期(总第157期)
应用能源技术
基于数据挖掘的电力系统异常数据辨识与调整
杨国强
(淮南电力公司,安徽淮南232007)
摘要:为了保证电力系统的可靠运行,需要对系统中的异常数据进行检测辨识与调整。在数据挖掘领域,模糊C均值聚类法(FCM)在处理小量低维的数据挖掘时是有效的,但是面向电力系统的数据库的数据挖掘是要处理大量、高维的数据,这样FCM算法在时间性能上难以令人满意。文中基于采样技术对FCM算法进行改进,利用遗传算法对聚类结采进行优化,利用一种新的基于遗传优化的采样模糊C均值聚类算法FFGO(FuzzyFCMwithGeneticOptimization),实现对异常数据的实时动态处理。
关键词:异常数据;数据挖掘;采样;模棚C均值聚类;遗传算法
中图分类号:TM712
3文章编号:1009-3230(2011)01-0025-04
文献标志码:B
PowerSystemDetectionandAdjustmentofBad
Data Based onDataMining
YANG Guo-qiang
(Huainan Power Supply Company,Huainan 232007,China)
Abstract: To ensure reliable operation of power system, the system would need to detect the bad data identification and adjustment. In data mining field, FCM algorithm is an efficient method in the
25
process of smallscale low dimensional database,but the time performanceofFCM algorithm can not be satisfied for the large scale high dimensional database. In this paper, a new sampling FCM algorithm with genetic optimization (FFGO) is presented based on the sampling technique and genetic algorithm. The sampling technique and genetic algorithm are used in FFGO algorithm to improve the
quality of clustering and realized the bad data real-time dynamic processing. Key words:Bad data;Bata mining; Sampling;FCM; Genetic algorithms
0前言
现代电力系统网络不断扩大,电力网络的结构与运行模式变得越来越复杂,各种调度自动化软件迫切需要准确的实时数据库作为其计算的基础。在电力系统的实际运行中,由于量测量和量测通道的误差及可能受到的干扰,个别量测量可能出现较大的误差,异常数据的存在,会给预测和分析造成极大困难,因此,异常数据的可靠检测与清洗是电力系统能否可靠运行的关键。
收稿日期:201011-10
修订期:2010-12-15
作者篇介:杨闵强(1962-),男,1.程师,主要从事白动化
系统技术管理T.作。
万方数据
对异常数据的识别与调整,目前已提出多种方法。文献[1]利用模糊C均值聚类法(FCM),通过统计负荷预测时历史上各日在两时刻间数据变化率的范围,对比待检测日这两点的数据变化率的范围,对比待检测日这两点的数据变化率是否在正常范围内来判定可疑点。该方法对于单个脏数据的识别比较有效,但对于首元素是脏数据及大段脏数据连续存在的情况,易产生误判和漏判,在算法处理的时间性能上也难以令人满意。文献[2]中提出了一种基于遗传算法的模糊聚类方法GGA,对模糊聚类质量作了一些改进,但是在对大型数据库进行处理时,时间性能也不佳,对异常数据的调整较为粗糙。