您当前的位置:首页>论文资料>基于猫群优化神经网络的语音情感识别

基于猫群优化神经网络的语音情感识别

资料类别:论文资料

文档格式:PDF电子版

文件大小:2.24 MB

资料语言:中文

更新时间:2024-12-20 13:51:48



推荐标签:

内容简介

基于猫群优化神经网络的语音情感识别 应用研究
基于猫群优化神经网络的语音情感识别,
数培1赵四方2李延强3
(1.河南师范大学计算机与信息工程学院河南新乡453007;
数事其本与质用
摘要:为了提高语音情感的识别率,本文首先采用线性判别分析将包据36个特征为韵律特征和38个特征为音质特征在内的74维语音情感特征向量降维为5维,以提高后续的识别率。热后提出了一种基于翁群算法优化的BP神经网络的权值和阅值,提高BP神经网络的妆效速度和学习能力。实验结果表明,与基于BP神经网络识别方法相比较,本文算法可以明显提高语音情感识列的性能。
关键词:猎群算法BP神经网络语音情感识列
中图分类号:TM715
文献标识码:A
本文首先采用线性判别分析(Linear Discrimination Analysis, LDA)对74维的情感特征向量进行降维,然后采用猫群算法优化BP 神经网络的权值和阀值,以克服BP神经网络收敛速度慢和易陷入局部最小的缺陷。实验表明,与BP神经网络识别效果相比较,本文基于
猫群优化的BP神经网络可以有效提高语音情感的识别率。 1基于LDA的情感特征向量降维
Fisher判别准则表达式为
Jttr(β)=βTS,/βTS_Φ
之n,(a,,ar)为类间离散度,
(1)
S.-(u--x》为总类内离散度,“,=元
郑类
1
的样本均值,"=-
之x为.总体样本均值。Fisher线性判别分析是 m
(中)达到最大值的中作为投影方向,使得投影后的样
要求得使得J,
本具有最大的类间离散度和最小的类内离散度。这里采用LDA将包括36个特征为韵律特征和38个特征为音质特征在内的74维语音情
感特征向量降维为5维,以提高后续的识别率。 2猫群算法优化的BP神经网络
为了提高BP神经网络"的收效速度和学习能力,本文采用猫群算法对网络的输人层与隐含层的连接权值,隐含层与输出层的连接权值以及各阅值进行优化。具体算法步骤如下:
Stepl:确定BP神经网络的拓扑结构。
Step2:对神经网络权值和阀值编码,得到初始化疆群
Step3:解码得到权值和阀值,并将权值和阀值赋给新建的BP网络。 SteD4:分别使用训练样本、测试样本训练和测试网络,并计算
测试误差。
Step5;按照式J(k,i)
测试样本
2 3 4 3 6
1
y+,k=1,2,.,N计算每
文章编号:1007-9416(2015)02-0120-0)
只猫的适应度,记录保留适应度最优的猫。其中(k,i)是第个个体第k次送代后的适应度值,n是训练集的样本数,Y。是第个个体的第m个样本输人时的网络目标输出值,,是第1个个体的第k次送代时第m个样本输人时的网络实际输出值,k为送代次数,N是最大送代次数,
Step6:根据分组率将猫群随机分成搜寻模式和跟踪模式两组。 Step7:根据猫的模式标志所确定的模式进行位置更新,如果猫
在搜寻模式下,则执行搜寻模式的行为;否则,执行跟踪模式的行为。
Step8:判断是否满足终止条件,若满足则输出最优解,结束程序,否则继续执行Step2,
3基于猫群优化神经网络的语音情感识别
本文训练样本集由男性和女性各三名,采用喜悦、愤整、惊诉、恐惧、悲伤和平静等六种情感(用标号1-6表示)分别朗读三遍20条不同的文本短句,获得2160条情感语料。选择20句中前15句做训练,后 5句做验证,识别结果如表1所示。与BP神经网络识别效果相比,本文方法的平均识别率达到84.2%,高于BP神经网络,且各种情感的误识
率也均有下降。 4结语
为了克服BP神经网络收敛速度慢和易于陷入局部最小值的缺陷,本文提出了一种基于猫群算法优化的BP神经网络。将基于猫群优化的BP神经网络用于对语音情感识别,实验结果表明,与基于BP
神经网络识别方法相比较,本文算法可以获得较高的识别率。参考文献
[1]刘文霞.高丹丹,赵天阳等.基于投影寻踪和BP神经网络的稳健型风场功率预测算法[J].电力系统保护与控制,2012,40(23):30-35.[2]孔令平.基于猫群算法的无线传感器网络路由优化算法研究[D]. 哈尔滨工业大学硕士学位论文,2013.
表1情感识别结果
BPNN识别结果(%)
2
79 4 7 3
5
收移日期:20150112
5 80 6 5 3 3
3 7
71 10 4 1
4 3 5 11 71 9 2
2 4 8 72 12
6 5 2 1 3 11 77
本交方法识别结果(%)
2
1 84 25 4 0 4
4 89 4 5 1 3
3 85
4 3
4 2 2 1 80 3 2
5 2 3 3 3 86 7
6 3
2 6 6 81
基金项日:河南省教育厅科学技术研究重点项日基础研究计划No.13A413506;河南师范大学大学生创新创业训继计划项目No.20140158 作者简介:教培(1979一),女,蒙古族,过宁沈阳人,讲师,博士,研究领城为智能信息处理;赵四方(1995一),男,汉族,河南林州人,本科,研究领城
为计算机科学与技术;李延强(1993一),男,汉族,河南中年人,本科,研究领域为思想政治教育。
20
上一章:安卓高速网络连接策略与流量负载均衡管理系统 下一章:智能抄表系统的无线传感网络设计

相关文章

粒子群优化 RBF 神经网络的语音识别研究 基于ELM神经网络的语音识别研究 基于自适应选择ELM集成的情感识别 基于MFCC的说话人语音识别系统的研究 基于小波去噪的语音识别系统 基于AVR单片机的语音识别系统设计 基于STM32的嵌入式语音识别模块设计 基于语音识别及WIFI技术的残障人员机器人助手