
数事执术与变用
应用研究
粒子群优化RBF神经网络的语音识别研究
王凯
(四川大学电气信息学院四川成都610065)
摘要:提出一种改进的径向基(RBF)神经网络,通过运用有监督的粒子群优化(PSO)聚类学习方法,来求解网络隐甚基西数中心和宽度。并将此改进的RBF神经网络用于语音识别,构建了语音识别伤真系统。结果表明,与标准RBF神经网络相比,PSO优化的RBF神经网络在缩短训练时间的同时,具有较高的识别率
关键调:粒子群径向基神经网络语音识别
中图分类号:TP39]
文献标识码:A
文章编号:1007-9416(2013)04-0109-02
Optimization of RBF Neural Network based
on PSO in speech recognition
WangKai
(School of Electrical Engineering and Information, Sichuan University, Chengdu, P.R.C 610065
Abstract:An improved Radial Basis Function (RBF) neural network has been proposed to obtain the center and width of hidden layer basis finction by using supervised particle swamm optimization (PSO) the clhustering learming methodk. This improved RBF neural network has been used for speech recognition and corresponding speech recognition simulation system has been built. Experimental results demonstrate that the PSORBF neural network has a higher recognition rate and has a shorter training time compared with standard RBF neural network.
Key Words:Particle swam optimization Radial basis function Neural network, Speech recognition
近年来,语音识别作为一种使捷的人机交互方式被大量研究,并在目常生活中得到广泛应用。大体上进,语音别就是在给定的语料库中找出与待识别词语相同的语料,其识别方法的选择对识别效果至关重要。语音识别的方法主要有3种:基于语音特征和声道模型的方法,模板匹配的方法和人工神经网络,第1种方法出现较早但由于其模型过于复杂,并未得到实际应用。第2种方法较为成熟,主要通过动态时间规整(DTW)、隐马尔可夫模型(HMM)和失量量化(VQ)技术实现)。第3种方法充分利用人工神经网络较强的分类
输出映射能力,非常适合解决语音识别这类难以用
能力和输人
算法描述而又有大量样本可供学习的问题
固此,本文将智能领域广泛使用的RBF神经网络运用到语音识别中,针对RBF神经网络隐层基函数的中心值和宽度随机确定的缺陷,运用具有全局寻优能力的粒子群算法(PSO)进行优化,来提高网络的泛化能力和收效速度,从而提高识别率。实验结果表明,粒子群优化的RBF神经网络用于语音识别,能够显著提升识别性能
1粒子群优化RBE神经网络
1.1RBF神经网络
Broomhead和Lowe在1988年首次将径向基(radialbasis function,RBF)这种多变量插值函数用于神经网络,提出了一种新的神经网络结构,其对任意连续函数有较高精度的逼近能力州。RBF 神经网络是一种局部逼近网络,对于每个训练样本,只需修正少量的网络连接权值和阅值,因此训练速度快,很适合于像语音识别这类实时性要求较高是场合,
RBF网络一般采用三层前向型结构,由输人层、隐含层和输出层组成。输人层是输人信号的源结点,结点数为输人向量的维数,输入信号由此层进人网络;隐含层中神经元传递函数采用对中心点径向对称且衰减的径向基函数;输出层是对隐含层的输出进行线性加权后输出。设网络的输人变量为X=(,,),输出变量为 Y=),),则有如下映射关系
小
we(x)+b
y 台
(1)
g(x)=exp
X
2g,
(2)
式中,()为第个隐层基函数,此处取高斯函数,k是隐层基函数的中心点个数,μ,为第i个隐层基函数的中心值,,为第i个隐层基函数的宽度,w和b分别为隐层到输出层的权值和阅值。
由此可见,用径向基函数作为隐层神经元传递函数,可以将输人直接映射到隐层空间,而不需要通过权连接,当基函数中心点确定后,该映射关系即可确定,而隐层空间到输出空间的映射是线性的。这样,网络输出权值可由线性方程直接解出,面RBF神经网络优化的关键就是隐层基函数中心值和宽度的选取。
1.2粒子群优化RBF网络算法
粒子群优化(particleswarmoptimization,PSO)算法是一种模仿鸟类捕食行为的群体智能优化算法,其由Kennedy和Eberhart 于1995年提出。PSO算法中每个粒子代表优化间题的一个潜在解,被赋予一个由适应度函数决定的适应度值。粒子的速度决定了粒子移动的方向和距离,速度随自身及其他粒子的移动经验进行动态调整,从而实现个体在可解空间中寻优。假设一个D维搜索空间,群体由N个粒子组成。在聚类过程中,先对这群粒子随机初始化,在送代过程中,通过跟踪个体最优值P和全局最优值P的变化,每个粒子不断更新自已的位置及速度。设第:个粒子的速度为 =("",),第个粒子的位置为X,=(X",),则粒子优化计算如下式:
v,(t + 1) = Wv, (t) +c,r(p,(t)x, (r)+ c,r(p, (t) x,(r) x. (r + 1) = x. () + v. (t + 1)
(3)(4)
式中,C、C,是对应的学习因子,本文中取为2,和r,取[0,1]间的随机数,W代表惯性权重,其取值将影响算法的收敛性,"()、 x.(),P(t)和P。(t)分别表示第次送代过程中,粒子i在第/维的速度、位置、个体最优位置和整个种群的全局最优位置。在进化的过程中,为了避免粒子飞出搜索空间外,V通常取值为-V,"], X,取值为[Xm;X],则将有Vax=k*Xmx,0.1≤k≤1.0
当粒子群优化算法在解空间搜索坐标时,为了避免粒子在全局
e 109