国家自然科学基金(11161140319)
- 作品数:24 被引量:61H指数:5
- 相关作者:颜永红王晶许春冬李军锋潘接林更多>>
- 相关机构:中国科学院北京理工大学江西理工大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划中国科学院战略性先导科技专项更多>>
- 相关领域:电子电信自动化与计算机技术交通运输工程建筑科学更多>>
- 嵌入式中文语音合成系统非周期成分音节层建模方法
- 2013年
- 当前主流参数化语音合成系统大多采用混合激励的源-滤波器模型,而非周期成分是影响合成音音质的重要参数。该文探讨了如何更有效地对非周期成分建模以及在嵌入式语音合成系统中非周期成分的模型规模如何尽可能压缩。该文通过分析得到非周期成分在中文音节中前后帧存在较强相关性,因此在一个音节内一段固定频段上,可以对非周期成分形成的一条连续轨迹通过离散余弦变换(dis-crete cosine transformation,DCT)来拟合。实验证明,该方法在保持合成音音质与基线系统相当的情况下,可以将分带非周期成分(band aperiodicity,BAP)模型的大小压缩到原来的6.64%。
- 王朝民谢湘匡镜明
- 关键词:语音合成
- 基于非负矩阵分解的钢琴多音符估计被引量:1
- 2014年
- 提出了一种基于能量谱包络非负矩阵分解的钢琴多音符估计算法。首先对钢琴88个单音片段进行RTFI时频分析,求得对应平均能量谱,经过时序平均、归一化求得平均能量谱包络,拼接成钢琴的单音能量谱包络基矩阵。之后对测试的多音片段,采用同样处理方法求得多音平均能量谱包络,通过非负矩阵分解求得各音符的权重系数,最后通过阈值限定求得多音符估计结果。性能评估实验基于MAPS数据集的UCHO集和RAND集展开,与MIREX中最好的钢琴音乐自动记谱系统相比,本文提出的钢琴多音符估计算法性能有很大幅度的提升。
- 万玉龙王宪亮周若华颜永红
- 关键词:钢琴音乐非负矩阵分解
- ANC次级通道在线建模的辅助噪声控制方法被引量:4
- 2014年
- 主动噪声控制(ANC)系统中利用辅助噪声作为激励信号对次级通道建模的方式,对系统达到稳态的残余噪声有较大的影响。本文提出了一种适用于次级通道在线建模的辅助噪声控制方法。引入两个自适应门限来控制辅助噪声的注入和停止:当次级通道的建模精度足够时,停止注入辅助噪声对次级通道建模,以减小稳态噪声残余;当次级通道发生变化时,重新注入辅助噪声,以跟踪次级通道的变化。仿真结果表明了提出算法的有效性。
- 杨茜吴超付强颜永红
- 关键词:主动噪声控制
- 基于PLDA的“一对多”下的说话人确认方法研究
- 近年来,概率线性鉴别分析(Probabilistic Linear Discriminant Analysis,PLDA)因其优异的性能而得到学者们的广泛关注。然而,各主流单位的PLDA研究都是基于NISTSRE 201...
- 许云飞黄厚军金怡珠李桂莲周若华
- 关键词:说话人识别
- 多特征融合的英语口语考试自动评分系统的研究被引量:10
- 2012年
- 该文主要针对大规模英语口语考试自动评分系统的问答题型,采用多特征融合的方法进行评分。以语音识别文本作为研究对象,提取了3类特征进行评分。这3类特征分别是:相似度特征、句法特征和语音特征。总共9个特征从不同方面描述了考生回答与专家评分之间的关系。在相似度特征中,改进了Manhattan距离作为相似度。同时提出了基于编辑距离的关键词覆盖率的特征,充分考虑了识别文本中存在的单词变异现象,为给考生一个客观公平的分数提供依据。所有提取的特征利用多元线性回归模型进行融合,得到机器评分。实验结果表明,提取的特征对机器评分是十分有效的,并且在以考生为单位的系统评分性能达到了专家评分性能的98.4%。
- 李艳玲颜永红
- 关键词:自动语音识别自动评分句法树
- Speex编码器中回声消除算法的分析与评估被引量:5
- 2013年
- 随着VoIP技术在近年来的快速发展,互联网语音通信得到了越来越多的应用,IP电话的语音通信质量成为制约其发展的重要因素,VoIP系统中远端信号会返回传递给说话人端从而引起回声,严重影响通话质量。所研究的Speex编码器中的频域MDF回声消除算法是通过估计最佳的LMS算法自适应变步长,同时结合NLMS滤波器消除远端信号的回声,达到提高语音通话舒适度的目的,给出了Speex中回声消除算法的原理和参数分析,并进行实际系统测试和性能评估。
- 杨果王亚洁王晶
- 关键词:回声消除自适应步长自适应滤波
- 一种结合G.719编解码器的参数立体声音频编解码扩展方法
- 2014年
- 针对ITU-T G.719全频带音频编码标准尚不支持立体声压缩编码的问题,结合G.719编解码器提出并设计基于离散傅里叶变换(discrete Fourier transform,DFT)的参数立体声音频编解码扩展模块.输入音频信号进行DFT变换后在子带内提取相应的空间参数,并将左右声道下混为和声道;解码时,对和声道进行能量补充,分别运用等式法和基于Givens旋转的奇异值分解法(singular value decomposition,SVD)进行解码恢复.测试结果表明,在G.719中合理设计参数立体声编解码可以获得较好的压缩效果,对于平缓的音乐,等式法比奇异值分解法可解码得到稍高的音质,且复杂度较低;对于变化较快的音乐,奇异值分解法可得到相对较好的音质,但复杂度较高.
- 王晶赵毅纪璇
- 基于ARM平台的VoIP回声消除算法优化和开发
- 随着Internet的迅速发展,语音通过网络传输成为现实,VoIP就是其中的一种新兴的语音数据通信技术。由于语音在传输过程中会产生回声,影响通话质量,在VoIP中加入回声消除模块已成必然。本文基于ARM嵌入式平台进行Vo...
- 王亚洁刘宝光赵毅蒋文锦王晶
- 关键词:VOIP回声消除ARM实现
- 一种嵌入式中文语音合成系统非周期成分音节层建模方法
- 当前主流参数化语音合成系统大多采用混合激励的源-滤波器模型,而非周期成分是影响合成音音质的重要参数。我们面临的问题一个是如何更有效的对非周期成分建模;另外在嵌入式语音合成系统中非周期成分的模型规模也需要尽可能压缩。本文通...
- 王朝民谢湘匡镜明
- 关键词:语音合成
- 两扬声器配置下的串声消除系统参数优化设置被引量:1
- 2014年
- 针对三维声音两扬声器重放中基本上独立研究逆滤波器的设计或扬声器的配置等因素对串声消除系统(CCS)性能的影响,提出了采用频域最小均方(LS)估计逼近方法,系统考察这些因素之间的关联以及对串声消除性能优化的作用,并通过折中考虑CCS的运算效率及系统性能获得了一组最优参数。实验采用通道分离度(CS)和性能误差(PE)两个指标对串声消除效果进行综合评价,仿真结果表明,该组最优参数能获得很好的串声消除效果。
- 许春冬李军锋裘嫄夏日升颜永红
- 关键词:三维声音逆滤波