国家自然科学基金(60970161) 作品数:5 被引量:20 H指数:2 相关作者: 郭武 戴礼荣 章钊 李轶杰 王仁华 更多>> 相关机构: 中国科学技术大学 更多>> 发文基金: 国家自然科学基金 中央高校基本科研业务费专项资金 更多>> 相关领域: 电子电信 自动化与计算机技术 更多>>
说话人识别中的因子分析以及空间拼接 被引量:14 2009年 联合因子分析可以有效拟合混合高斯模型中的说话人和信道差异,在说话人识别中得到广泛应用.一般情况下,该算法在对说话人和信道两个载荷矩阵进行联合估计时,说话人残差矩阵无法发挥作用,信道载荷矩阵的因子数不能提高.本文提出说话人载荷矩阵、说话人残差载荷矩阵采用串行的训练模式,在信道载荷矩阵训练中采用矩阵拼接的方法,能够有效提高识别率;在NIST SRE 2008年核心测试数据库的五个部分分别达到等错误率3.3%,5.1%,5.0%,5.3%和5.0%. 郭武 李轶杰 戴礼荣 王仁华关键词:说话人识别 说话人确认 期望最大化 声纹识别中合成语音的鲁棒性 被引量:3 2011年 随着以隐马尔科夫模型为基础的语音合成技术的发展,冒认者很容易利用该技术生成具有目标说话人特性的合成语音,这对现有的声纹识别系统构成巨大威胁.针对此问题,文中从统计学的角度分析自然语音与合成语音在实倒谱上的区别,并提出对合成语音具有鲁棒性的声纹识别系统.实验结果初步表明,相比于传统的声纹识别系统,在对自然语音的等错误率不变的情况下,该系统对合成语音的错误接受率由99.2%降为0. 陈联武 郭武 戴礼荣关键词:声纹识别 话者识别中结合模型和能量的语音激活检测算法 被引量:1 2010年 语音激活检测是检测语音起始终止端点的一种算法,合适地选择语音来进行说话人模型的注册和测试对话者识别系统的性能有很大影响.本文将基于能量的语音激活检测算法与基于模型的算法相结合来检测语音,在N IST2006核心测试数据集上,采用本文算法的系统相对于传统基于能量的方法性能最多有19%的提升. 章钊 郭武关键词:语音激活检测 说话人识别 支持向量机 采用韵律特征的说话人确认系统 被引量:1 2010年 在文本无关的说话人识别中,韵律特征由于其对信道环境噪声不敏感等特性而被应用于话者识别任务中。本文对韵律参数采用基于高斯混合模型超向量的支持向量机建模方法,并将类内协方差特征映射方法应用于模型超向量上,单系统的性能比传统方法的混合高斯-通用背景模型(Gaussian mixture model-universalbackground model,GMM-UBM)基线系统有了40.19%的提升。该方法与本文的基于声学倒谱参数的确认系统融合后,能使整体系统的识别性能有9.25%的提升。在NIST(National institute of standards and technology mixture)2006说话人测试数据库上,融合后的系统能够取得4.9%的等错误率。 龙艳花 郭武 戴礼荣关键词:说话人确认 韵律特征 基于HMM-UBM的声纹密码识别 被引量:1 2012年 声纹识别中,提出基于隐马尔可夫-通用背景模型的识别算法.针对声纹密码中每个人的注册语音数据量很少的问题,提出使用大量其他人数据先建立话者无关的声韵母隐马尔可夫模型作为通用背景模型,再根据最大后验概率准则,以通用背景模型为基础使用训练语音自适应获得说话人模型.该方法解决在声纹密码识别中训练数据不足的问题.在讯飞桌面数据库Ⅱ上,采用该算法的系统的等错误率为6.8%. 章钊 郭武 戴礼荣关键词:高斯混合模型