基于VQ-MAP与LS-SVM融合的说话人识别系统

出处:davidli88 发布于:2010-08-23 21:51:55

     摘   要: 传统的二乘支持向量机(LS-SVM)使用特征向量作为训练样本,在说话人识别系统中应用时区分性不够明显。对此,提出VQ-MAP与LS-SVM融合的方法,使用通用背景模型(UBM)经过VQ-MAP过程得到说话人自适应参数集,把此参数集作为二乘支持向量机的训练样本应用于说话人识别系统中。用Matlab进行仿真实验,结果表明,该识别系统SVM训练时间短,且具有较高的识别率。

  说话人识别是从说话人的一段语音中提取出说话人的个性特征,通过对这些个性特征的分析和识别,从而达到对说话人进行辨认或者确认的目的。它可以分为两个范畴:说话人辨认和说话人确认。说话人辨认是辨认出待识别的语音是来自待考察的个人中的哪一个;而说话人确认则是特定的参考模型和待识别模式之间的比较,系统只做出“是”或“不是”的二元判决。

  Ville Hautamaki[2]等人提出了后验概率矢量量化(VQ-MAP)过程,它可以看作是GMM-MAP的一种特殊形式;Suykens等人[3]提出了二乘支持向量机LS-SVM的概念,而志平等人[4]将二乘向量机应用在说话人识别系统中,并取得了较好的效果。

  VQ-MAP过程首先只依照均值对通用背景模型UBM(Universal Bakground Model)进行聚类,然后应用VQ-MAP过程来更新自适应参数,由此训练语音未覆盖到的部分就可以用UBM中说话人无关的特征分布近似,以减小训练语音太短带来的影响。将得到的自适应参数集作为二乘向量机的训练样本,在说话人识别中进行应用,取得了较好的效果。本文介绍了VQ-MAP和LS-SVM融合的说话人识别系统,并在说话人识别中进行了应用。

  1 VQ-MAP过程

  在说话人识别中,可以使用训练集中的发音数据对UBM进行参数自适应来得到发音人的模型。高斯混合模型在后验概率自适应(GMM-MAP)过程中需要更新3种参数:权值、均值向量和协方差矩阵。VQ-MAP过程是GMM-MAP的一种特殊形式,它只依照均值向量来得到新的自适应说话人模型。依照均值向量为参数用K均值聚类算法对UBM进行聚类,从而得到一组均值矢量:


  2 二乘支持向量机

  Suykens等人[3]在SVM的优化函数中引入方差项,并将SVM中的不等式约束条件改为等式约束,提出了一种以二次等式约束条件为基础的改进型向量机即二乘向量机(LS-SVM)。这样LS-SVM的求解问题从标准SVM的二次函数寻优问题转换为线性方程求解问题, 解决了二次寻优算法费时且不易用于实时数据处理的问题,从而大大地简化了问题的复杂性。


  方程的性条件如下:



  3 融合算法

  3.1选择样本


  设计1个SVM,分别标记这2个说话人自适应参数集为{+ 1,- 1}类,将每帧测试语音特征矢量输入到1个训练支持向量机中,对每帧矢量判别是哪一类,当所有的测试语音特征矢量判别完毕后, 采用投票方法判决,得票多者就为目标说话人。

  实验1:同一语音库下,随着说话人人数的变化,VQ-MAP和LS-SVM融合的说话人识别系统与基于LS-SVM的说话人识别系统中SVM训练时间进行对比,两个系统中LS-SVM均采用径向基核函数,取γ=0.125,结果如图1所示。


  由图1可以看出,随着说话人数越多,所需SVM训练时间越长。当说话人数为50时,应用VQ-MAP和SVM融合的系统SVM训练时间仅仅是直接用LS-SVM训练时间的36.6%。这是因为直接用LS-SVM时,把每个说话人所有帧的特征向量都作为输入矢量来训练SVM,而在VQ-MAP和LS-SVM融合方法中,只把VQ-MAP自适应更新模型中的K个向量作为输入矢量训练SVM,大大减少了运算量,因而提高了识别速度。

  实验2:同一语音库下,VQ-MAP和LS-SVM融合的说话人识别系统与基于LS-SVM的说话人识别系统识别率进行对比,比较结果如表1所示。


  从表1可以看出,随着测试时长的增加, VQ-MAP和LS-SVM融合方法识别率不断提高,且明显高于LS-SVM方法。这是因为在VQ-MAP算法中,采用了均值矢量通过UBM进行自适应来得到说话人模型,在训练语音未覆盖到的部分就可以用UBM中说话人无关的特征分布近似,减小训练语音太短带来的影响,从而为提高识别率打下良好的基础。

  本文介绍的VQ MAP和LS-SVM融合说话人识别系统,比直接应用LS-SVM训练效率提高了36.6%,且识别率也高于LS-SVM方法,尤其是在测试时长为8 s时,比传统的LS-SVM方法识别率提高了4.2%,为在说话人识别系统中使用多系统融合提供了新的途径,是一种行之有效的方法。


  

版权与免责声明

凡本网注明“出处:维库电子市场网”的所有作品,版权均属于维库电子市场网,转载请必须注明维库电子市场网,https://www.dzsc.com,违反者本网将追究相关法律责任。

本网转载并注明自其它出处的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品出处,并自负版权等法律责任。

如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。

广告
上传BOM文件: BOM文件
*公司名:
*联系人:
*手机号码:
QQ:
应用领域:

有效期:
OEM清单文件: OEM清单文件
*公司名:
*联系人:
*手机号码:
QQ:
有效期:

扫码下载APP,
一键连接广大的电子世界。

在线人工客服

买家服务:
卖家服务:

0571-85317607

客服在线时间周一至周五
9:00-17:30

关注官方微信号,
第一时间获取资讯。

建议反馈

联系人:

联系方式:

按住滑块,拖拽到最右边
>>
感谢您向阿库提出的宝贵意见,您的参与是维库提升服务的动力!意见一经采纳,将有感恩红包奉上哦!