
数事本与率用
基于ELM神经网络的语音识别研究
王威胡桂明杨丽黄东芳周杨
(广西大学电气工程学院广西南宁530004)
应用研究
摘要:ELM神经网络是一种新的神经网络,近几年来在数据拟合和模式识别等方面得到了广泛的研究。该算法的模型是基于单隐舍神经网络(SLFNs),相比需要经过长期选代求解参数的其他网络,该算法只需要一次求解就能训练好网络参数,是一种快速训练算法。本文将该算法与时间规整相结合对语青进行识别研究,与SVM相比,ELM具有受快的训练违度,且识别效累良好。
关键词:语音识别ELMSVM时间规整
中图分类号:TN912.34
文献标识码:A
近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。
其中涉及的主要过程分为三步,首先是信号的预处理,其中包括预加重、加窗分赖、端点检测等。然后对其进行特征提取,常用的特征提取方法有Mel频率倒谱系数"(MFCC),其中MFCC具有较强的抗噪能力以及模拟人耳听觉特性,识别性能较LPCC有一定的提升。最后是对语音信号进行训练识别,目前比较流行的识别技术包括概率统计模型和模板匹配模型2种)
当语音识别前两步方法相同时,得到的特征参数也相同,最后的训练效果取决于所用训练模型。在模板匹配模型中,比较经典的训练方法是人工神经网络(ANN)算法,该方法具有很多不同的网络,面不同的网络具有不同的优势和缺陷。本文采用的ELM就是一种 ANN算法。
基于ELM的语音识别系统分为以下几个部分:语音信号的采集、预处理、语音信号特征参数的提取和ELM模型的训练和识别。 1特征提取及后期处理
1.1MFCC参数提取
MFCC是基于人的听觉机理来分析语音的频谱,人对赖率的感觉并不是成线性对应关系,而是一种非线性对应关系。MFCC就是利用这种关系,将原来以Hz为单位的实际频率转换成Mel为单位的感知频率。
其具体转化关系如下: F.-. =1127In(1+ f / 700) MFCC参数计算流程如下,
(1)首先对信号进行预处理,一般包括预加重、分慎、加窗
(2)对每慎信号进行快速傅里叶(FFT)变换,然后求其频谱,进面求得谱线的能量
(3)把每慎信号谱线能量通过Mel滤波器,从面得到输出滤波器后的能量:
(4)对所有滤波器输出的能量做对数运算,再进一步微离散余要
预处理一
FFT
谱线能量
Mel 滤波
图1MFCC参数提取原理框图表1两种算法的性能比较结果
算速
96.9
ELM
96.9
96.3
96.996.3
求对数 DCT
识别率(% 96.7
SVM95.0
95.095.095.095.0
95.0
收移日期:2015-01-15
时间](s) 0.11 11.52
文章编号:1007-9416(2015)01-0103-02 变换DCT可得到MFCC参数。
具体原理框图如图1所示。 1.2特征参数的时间规整
考虑提取后语音信号的慎数也不同,需要对特征矩阵进行降维,本文采用时间规整算法对数据进行降维。
若语音信号经过端点检测后有效语音赖数为Ⅱ,为了使神经网络输人层节点个数固定,需要将其规整到m赖,建立一个时间规整网络,网络输人层有n个节点,最后输出层有M个节点,每个节点对应一慎语音特征向量。从第一层开始分别求相邻特征向量的距离,并把距离最近的两顿间量按照一定的权重合并为一赖送人下一层,而本层其余节点对应的慎向量则直接进人下一层。这样在第一层就少了一慎,按照这种方式每经过一层网络就会压缩一慎语音数据。最后经过n-m层网络后特征参数规整到m赖。
1.3特征参数的归一化
数据归一化是神经网络预测前对数据常做的一种处理方法。本文采用MATLAB8.3中mapminmax数对特征参数进行归一化,其公式为:
,= Xrus X,i
其中,为需要进行归一化处理的数据,X是一向量数据中的最小值,X是一向量数据中的最大值,工,则代表处理后的数据。最
后归一化后数据范围为(0,1)。 2极限学习机
2006年,Huang等人提出了极限学习机算法(ELM),该算法是种快速训练算法,它是在单隐含层神经网络基础上的一种改进算法。
具有M个隐节点的单隐层前向神经网络(SLFNs)的数学模型
为
8 (x)=
Ee(a,b,x)
其中a,=[,4,是第个隐含层结点相连的输人权值,是第i个隐含层结点的偏差,,=[5…5丁是第个隐含层结点与输出层结点之间的权值。(a,,x)表示关于输入x在第1个隐含层节点的输出。
给定N
个不同样本((x,)j=,-,N)
,其中
, =[-, e R*, , [y,]e 。
若网络的实际输出等于期望输出,则有 s (a,,+)=/ =1,..
上述N个等式可以写成如下矩阵形式
作者简介:王威(1990一),男,江西省南城县人,项士研究生,研究方向:智能自动化;胡桂明(1961一),男,广西桂林人,博士,硕士生导师,研究方
向:智能优化控制和智能信息处理,
103