公共文化服务平台

基于GMM非线性变换的说话人识别算法的研究被引量：1: 2017年; 针对与文本无关说话人识别GMM模型中,某些非目标模型的测试帧的模型得分可能会比较高,从而引起误判的问题。从帧似然概率的统计特性出发,提出了一种GMM非线性变换方法。该方法通过对每帧各模型的得分赋予不同的权值,使得得分高的模型权值大,得分低的模型权值小,由于目标模型得分高的帧要多于其他非目标模型,所以这样可以提高目标模型的总得分,降低非目标模型的得分,从而降低误判的可能。理论推导和实验结果表明,该变换方法能够提高GMM说话人识别的识别率。; 罗文华杨彦齐健赵力; 关键词：混合高斯模型

基于修正Fukunaga-Koontz变换的说话人识别方法: 2018年; 研究了修正Fukunaga-Koontz变换在说话人识别中的应用方法。通过修正Fukunaga-Koontz变换对说人语音特征空间进行了降维,并通过高斯混合模型进行说话人建模。采用NIST 2006年测试的1conv4w-1conv4w作为实验,对比了LDA方法与修正Fukunaga-Koontz变换在说话人识别中的识别性能。结果证实,将修正Fukunaga-Koontz变换用于说话人识别获得了理想的效果,与传统的LDA降维方法相比,识别性能得到了较大的提升。; 赵艳吕亮赵力; 关键词：说话人识别

实时助听器回声消除算法研究: 回声会导致助听器产生啸叫,损坏助听器设备,破坏患者的残余听力。为此,本文在助听器回声抵消模型的基础上,针对输入信号的能量变化,研究了自适应助听器回声抵消算法。通过对比标准最小均方差(NormalizedLeast Mea...; 仇晓梅吕晓敏房徐琪马安骏; 关键词：数字助听器回声抵消; 文献传递

一种分布式风力机信息采集和状态监测系统的设计被引量：4: 2016年; 为了对风电机组实时远程监控并实现分布式网络化管理,设计了一种基于ARM嵌入式系统的风电机组振动监测系统。系统有24通道的模拟信号采集电路,并借助于FPGA对周围电路进行逻辑控制和数据的实时采样;FPGA与ARM通信应用EDMA技术,极大提高了数据传输速率,可满足高速率采样的数据传输要求;此外,上位机与目标板之间的数据通信采用TCP/IP协议。通过实验观察上位机输出结果,验证了数据的实时性和准确性,达到了对风电机运行的状态信息监测和故障诊断的要求。; 李月芳梁瑞宇; 关键词：风电机组 ARM FPGA EDMA

用于跨库语音情感识别的时频原子听觉注意模型（英文）: 2016年; 为解决跨数据库语音情感识别领域中实验数据集特征不匹配的问题,提出一种基于时频原子的听觉注意特征提取模型.首先,为了提取频谱特征,引入听觉注意模型对多类情感特征进行有效的探测.然后,利用选择注意机制改进了提取的语谱图特征,其中包含的显著性信息与跨库识别性能有紧密联系.再引入Chirplet时频原子,通过形成的过完备原子库提高语谱图特征的信息量.来自多个数据库的样本具有多成分分布的特征,据此所提模型中的Chirplet扩大了特征向量在时频域上的尺度.实验结果显示,相比传统特征模型,所提方法性能有显著提升.此外,该方法在训练集和测试集来源不一致情况下具有更好的鲁棒性.; 张昕然宋鹏查诚陶华伟赵力; 关键词：语音情感识别

联合时频域中增强后耳语音的可懂度评估(英文)被引量：1: 2014年; 对在联合时频域影响增强后耳语音可懂度的因素进行了评估.分析了耳语音时频谱密度和增强后耳语音时频谱中不同区域对耳语音可懂度的影响.实验结果表明,在基于增益修正的时频域语音增强算法中,采用密度较高的耳语音谱可提高增强后耳语音可懂度.此外,在增强后的耳语音的时频谱中,频谱幅度小于干净耳语音时频谱的频谱区域对增强后的耳语音的可懂度提高最为重要,而那些频谱幅度大于2倍干净耳语音频谱的频谱区域对增强后的耳语音的可懂度具有消极作用.; 周健魏昕梁瑞宇赵力; 关键词：实值离散GABOR变换

一种自适应多通道响度补偿方法（英文）: 2016年; 为减小助听器系统中传统响度补偿方法中语音可听和畸变之间的矛盾,提出了一种自适应的多通道响度补偿方法.该方法根据带通信号的动态范围和患者的听阈交替使用线性方法和动态范围压缩方法.为进一步减小动态范围压缩引起的畸变,并提高噪声环境下的输出信噪比,给出了一种自适应调整压缩比的方法.实验结果表明,与WDRC动态范围压缩补偿方法相比,所提方法在语噪声环境下的输出信噪比至少提高了1.73 dB;与线性和动态范围压缩补偿方法相比,所提方法的平均语音可懂度分别提升了6.0%和5.7%.; 王侠梁瑞宇王青云申红明赵力邹采荣; 关键词：助听器

工作环境中的语音烦躁情绪检测方法(英文): 2013年; 为了检测工作人员的烦躁情绪,实现情感状态的评价,通过在工作环境中诱发情感语音,获取了足够的测试样本,建立了2 000条样本的工作环境情感语音数据库.在检测烦躁情绪过程中,首先提取语音的韵律特征和音质特征参数,然后利用基于蛙跳算法的改进的BP神经网络进行烦躁情绪识别.实验比较了BP,RBF和SFLA神经网络的性能,结果显示SFLA神经网络的识别率比BP神经网络高4.7%,比RBF神经网络高4.3%.实验结果表明,使用蛙跳算法训练随机初始数据可以优化神经网络的连接权重和阈值,加快收敛速度,提高识别率.; 王青云赵力梁瑞宇张潇丹; 关键词：蛙跳算法

Cooperative Compressive Spectrum Sensing in Cognitive Underw ater Acoustic Communication Networks: 2015年; Because of the specific of underwater acoustic channel,spectrum sensing entails many difficulties in cognitive underwater acoustic communication( CUAC) networks, such as severe frequency-dependent attenuation and low signal-to-noise ratios. To overcome these problems, two cooperative compressive spectrum sensing( CCSS) schemes are proposed for different scenarios( with and without channel state information). To strengthen collaboration among secondary users( SUs),cognitive central node( CCN) is provided to collect data from SUs. Thus,the proposed schemes can obtain spatial diversity gains and exploit joint sparse structure to improve the performance of spectrum sensing. Since the channel occupancy is sparse,we formulate the spectrum sensing problems into sparse vector recovery problems,and then present two CCSS algorithms based on path-wise coordinate optimization( PCO) and multi-task Bayesian compressive sensing( MT-BCS),respectively.Simulation results corroborate the effectiveness of the proposed methods in detecting the spectrum holes in underwater acoustic environment.; 左加阔陶文凤包永强赵力邹采荣

基于改进的深度神经网络的说话人辨认研究: 2017年; 说话人辨认技术在许多领域有着广泛的应用前景。首先研究了两种基本的深度神经网络模型(深度信念网络和降噪自编码)在说话人辨认上的应用,深度神经网络通过逐层无监督的预训练和有监督的反向微调避免了反向传播容易陷入局部最小值的缺陷,通过实验证明了当神经元个数达到一定数量之后深度网络模型是优于普通BP网络的,并且其性能随着网络规模的扩大而提升。考虑到大规模的深度网络训练时间较长的缺点,提出使用整流线性单元(Re LU)代替传统的sigmoid类函数对说话人识别的深度模型进行改进,实验结果表明改进后的深度模型平均训练时间减少了35%,平均误识率降低了8.3%。; 赵艳吕亮赵力; 关键词：说话人辨认

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

国家自然科学基金(61301219)

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

国家自然科学基金(61301219)

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈