学术论文

      基于语音声学特征的情感信息识别

      Speech emotion recognition using acoustic features

      摘要:
      为提高情感语音识别的正确率,研究了声学参数的统计特征和时序特征在区分情感中的作用,并提出了一种将两者相融合的情感识别方法.在提取出基本的韵律参数和频谱参数后,首先利用PNN(probabilistic neural network)和HMM(hidden markov model)分别对声学参数的统计特征和时序特征进行处理.计算它们各自属于每类情感的概率,获得采用加法规则和乘法规则融合统计特征和时序特征的识别结果.实验结果表明: 各组特征在区分情感方面的侧重不尽相同,通过特征融合,平均识别正确率相较单独采用统计特征或时序特征均有提高,在最好情况下达到了92.9%. 这说明了该方法的有效性.
      作者: 蒋丹宁 蔡莲红
      Author: JIANG Danning CAI Lianhong
      作者单位: 清华大学,计算机科学与技术系,北京,100084
      年,卷(期): 2006, 46(1)
      分类号: TP391.4
      机标分类号: TP3 F59
      在线出版日期: 2006年4月13日
      基金项目: 中国科学院资助项目