您的位置: 专家智库 > >

浙江省自然科学基金(Y106705)

作品数:3 被引量:18H指数:2
相关作者:杨莹春张立华李冬冬吴朝晖单振宇更多>>
相关机构:浙江大学更多>>
发文基金:浙江省自然科学基金教育部“新世纪优秀人才支持计划”长江学者和创新团队发展计划更多>>
相关领域:电子电信自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 2篇电子电信
  • 1篇自动化与计算...

主题

  • 2篇语音
  • 2篇说话人识别
  • 2篇情感语音
  • 1篇识别方法
  • 1篇说话人识别方...
  • 1篇说话人识别系...
  • 1篇情感
  • 1篇混合模型
  • 1篇基频
  • 1篇高斯
  • 1篇高斯混合
  • 1篇高斯混合模型
  • 1篇UBM

机构

  • 3篇浙江大学

作者

  • 3篇杨莹春
  • 1篇单振宇
  • 1篇吴朝晖
  • 1篇李冬冬
  • 1篇张立华

传媒

  • 1篇模式识别与人...
  • 1篇清华大学学报...
  • 1篇浙江大学学报...

年份

  • 2篇2009
  • 1篇2008
3 条 记 录,以下是 1-3
排序方式:
基于基频的情感语音聚类的说话人识别方法被引量:2
2009年
针对存在情感差异性语音情况下说话人识别系统性能急剧下降以及缺乏充足情感语音训练说话人模型的问题,提出一种基于基频的情感语音聚类的说话人识别方法,能有效利用系统可获取的少量情感语音.该方法通过对男女说话人设定不同的基频阈值,根据阈值,对倒谱特征进行聚类,为每个说话人建立不同基频区间的模型.在特征匹配时,选用最大似然度的基频区间模型的得分作为该说话人的得分.在中文情感语音库上的测试结果表明,与传统的基于中性训练语音的高斯混合模型说话人识别方法和结构化训练方法相比,该方法具有更高的识别率.
李冬冬吴朝晖杨莹春
关键词:情感语音基频说话人识别
情感语音变化规律的特征分析被引量:14
2008年
为了探索情感语音相对于中性语音的变化规律,该文对实验室采集的中文情感语音库M A SC@CCNT进行初步实验分析。首先对语音库进行听辨分析,甄选感情明显的语料,再针对含有兴高采烈、愤怒、惊慌、悲伤等4种情感的语音信号,分析它们的时间构造、能量构造、基频构造和共振峰构造的特征,并通过和不带感情的平静语音信号特征进行比较,得出了不同情感信号特征的分布变化规律。结果表明:时间构造、频谱、能量、基音频率和元音共振峰这5种特征在分辨情感语音上有着明显的作用,而悲伤情感最易分辨;情感语音的变化没有统一的规律,因说话人的性别而异,甚至因人而异。
张立华杨莹春
基于UBM降阶算法的高效说话人识别系统被引量:2
2009年
为了提高基于高斯混合模型-通用背景模型(GMM-UBM)说话人识别系统的运算速度,提出了通用背景模型(UBM)降阶算法,该方法采用极大似然估计法训练一个高阶UBM,再采用UBM降阶算法得到低阶UBM.采用最短距离高斯分量替换空映射集合的方法解决了空映射集问题.通过实验方法分析了3种初始化低阶UBM方法的识别结果,发现不同的初始化方法对结果影响很小.在NIST2001 SRE数据库上的实验显示,该算法使基于GMM-UBM说话人识别系统的运算速度提高了8倍,而等错误率仅上升了4.59%,表明了UBM降阶算法在小幅降低系统识别率的情况下,可大幅度提高GMM-UBM系统的运行效率.
单振宇杨莹春
关键词:说话人识别高斯混合模型
共1页<1>
聚类工具0