国家高技术研究发展计划(2006AA01Z136) 作品数:3 被引量:18 H指数:2 相关作者: 杨莹春 张立华 李冬冬 吴朝晖 单振宇 更多>> 相关机构: 浙江大学 更多>> 发文基金: 浙江省自然科学基金 教育部“新世纪优秀人才支持计划” 长江学者和创新团队发展计划 更多>> 相关领域: 电子电信 自动化与计算机技术 更多>>
基于UBM降阶算法的高效说话人识别系统 被引量:2 2009年 为了提高基于高斯混合模型-通用背景模型(GMM-UBM)说话人识别系统的运算速度,提出了通用背景模型(UBM)降阶算法,该方法采用极大似然估计法训练一个高阶UBM,再采用UBM降阶算法得到低阶UBM.采用最短距离高斯分量替换空映射集合的方法解决了空映射集问题.通过实验方法分析了3种初始化低阶UBM方法的识别结果,发现不同的初始化方法对结果影响很小.在NIST2001 SRE数据库上的实验显示,该算法使基于GMM-UBM说话人识别系统的运算速度提高了8倍,而等错误率仅上升了4.59%,表明了UBM降阶算法在小幅降低系统识别率的情况下,可大幅度提高GMM-UBM系统的运行效率. 单振宇 杨莹春关键词:说话人识别 高斯混合模型 情感语音变化规律的特征分析 被引量:14 2008年 为了探索情感语音相对于中性语音的变化规律,该文对实验室采集的中文情感语音库M A SC@CCNT进行初步实验分析。首先对语音库进行听辨分析,甄选感情明显的语料,再针对含有兴高采烈、愤怒、惊慌、悲伤等4种情感的语音信号,分析它们的时间构造、能量构造、基频构造和共振峰构造的特征,并通过和不带感情的平静语音信号特征进行比较,得出了不同情感信号特征的分布变化规律。结果表明:时间构造、频谱、能量、基音频率和元音共振峰这5种特征在分辨情感语音上有着明显的作用,而悲伤情感最易分辨;情感语音的变化没有统一的规律,因说话人的性别而异,甚至因人而异。 张立华 杨莹春基于基频的情感语音聚类的说话人识别方法 被引量:2 2009年 针对存在情感差异性语音情况下说话人识别系统性能急剧下降以及缺乏充足情感语音训练说话人模型的问题,提出一种基于基频的情感语音聚类的说话人识别方法,能有效利用系统可获取的少量情感语音.该方法通过对男女说话人设定不同的基频阈值,根据阈值,对倒谱特征进行聚类,为每个说话人建立不同基频区间的模型.在特征匹配时,选用最大似然度的基频区间模型的得分作为该说话人的得分.在中文情感语音库上的测试结果表明,与传统的基于中性训练语音的高斯混合模型说话人识别方法和结构化训练方法相比,该方法具有更高的识别率. 李冬冬 吴朝晖 杨莹春关键词:情感语音 基频 说话人识别