您的位置: 专家智库 > >

国家自然科学基金(61301219)

作品数:9 被引量:6H指数:1
相关作者:赵力梁瑞宇赵艳王青云李月芳更多>>
相关机构:东南大学南京工程学院常州轻工职业技术学院更多>>
发文基金:国家自然科学基金江苏省自然科学基金安徽省自然科学基金更多>>
相关领域:电子电信自动化与计算机技术电气工程动力工程及工程热物理更多>>

文献类型

  • 9篇期刊文章
  • 1篇会议论文

领域

  • 8篇电子电信
  • 2篇自动化与计算...
  • 1篇动力工程及工...
  • 1篇电气工程
  • 1篇医药卫生

主题

  • 4篇英文
  • 3篇语音
  • 2篇说话人识别
  • 2篇助听器
  • 1篇电机
  • 1篇堆叠
  • 1篇多通道
  • 1篇信念网络
  • 1篇信息采集
  • 1篇语谱图
  • 1篇语音情感
  • 1篇语音情感识别
  • 1篇整流
  • 1篇神经网
  • 1篇神经网络
  • 1篇时频
  • 1篇时频原子
  • 1篇实值离散GA...
  • 1篇识别方法
  • 1篇数据库

机构

  • 7篇东南大学
  • 6篇南京工程学院
  • 1篇河海大学
  • 1篇安徽大学
  • 1篇常州轻工职业...
  • 1篇南京邮电大学
  • 1篇南通大学
  • 1篇烟台大学
  • 1篇盐城工业职业...

作者

  • 7篇赵力
  • 4篇梁瑞宇
  • 2篇王青云
  • 2篇赵艳
  • 1篇陶华伟
  • 1篇仇晓梅
  • 1篇查诚
  • 1篇宋鹏
  • 1篇张潇丹
  • 1篇邹采荣
  • 1篇申红明
  • 1篇王侠
  • 1篇马安骏
  • 1篇李月芳
  • 1篇张昕然
  • 1篇魏昕
  • 1篇杨彦
  • 1篇罗文华
  • 1篇周健
  • 1篇齐健

传媒

  • 4篇电子器件
  • 4篇Journa...
  • 1篇Journa...

年份

  • 1篇2018
  • 2篇2017
  • 3篇2016
  • 1篇2015
  • 2篇2014
  • 1篇2013
9 条 记 录,以下是 1-10
排序方式:
基于GMM非线性变换的说话人识别算法的研究被引量:1
2017年
针对与文本无关说话人识别GMM模型中,某些非目标模型的测试帧的模型得分可能会比较高,从而引起误判的问题。从帧似然概率的统计特性出发,提出了一种GMM非线性变换方法。该方法通过对每帧各模型的得分赋予不同的权值,使得得分高的模型权值大,得分低的模型权值小,由于目标模型得分高的帧要多于其他非目标模型,所以这样可以提高目标模型的总得分,降低非目标模型的得分,从而降低误判的可能。理论推导和实验结果表明,该变换方法能够提高GMM说话人识别的识别率。
罗文华杨彦齐健赵力
关键词:混合高斯模型
基于修正Fukunaga-Koontz变换的说话人识别方法
2018年
研究了修正Fukunaga-Koontz变换在说话人识别中的应用方法。通过修正Fukunaga-Koontz变换对说人语音特征空间进行了降维,并通过高斯混合模型进行说话人建模。采用NIST 2006年测试的1conv4w-1conv4w作为实验,对比了LDA方法与修正Fukunaga-Koontz变换在说话人识别中的识别性能。结果证实,将修正Fukunaga-Koontz变换用于说话人识别获得了理想的效果,与传统的LDA降维方法相比,识别性能得到了较大的提升。
赵艳吕亮赵力
关键词:说话人识别
实时助听器回声消除算法研究
回声会导致助听器产生啸叫,损坏助听器设备,破坏患者的残余听力。为此,本文在助听器回声抵消模型的基础上,针对输入信号的能量变化,研究了自适应助听器回声抵消算法。通过对比标准最小均方差(NormalizedLeast Mea...
仇晓梅吕晓敏房徐琪马安骏
关键词:数字助听器回声抵消
文献传递
一种分布式风力机信息采集和状态监测系统的设计被引量:4
2016年
为了对风电机组实时远程监控并实现分布式网络化管理,设计了一种基于ARM嵌入式系统的风电机组振动监测系统。系统有24通道的模拟信号采集电路,并借助于FPGA对周围电路进行逻辑控制和数据的实时采样;FPGA与ARM通信应用EDMA技术,极大提高了数据传输速率,可满足高速率采样的数据传输要求;此外,上位机与目标板之间的数据通信采用TCP/IP协议。通过实验观察上位机输出结果,验证了数据的实时性和准确性,达到了对风电机运行的状态信息监测和故障诊断的要求。
李月芳梁瑞宇
关键词:风电机组ARMFPGAEDMA
用于跨库语音情感识别的时频原子听觉注意模型(英文)
2016年
为解决跨数据库语音情感识别领域中实验数据集特征不匹配的问题,提出一种基于时频原子的听觉注意特征提取模型.首先,为了提取频谱特征,引入听觉注意模型对多类情感特征进行有效的探测.然后,利用选择注意机制改进了提取的语谱图特征,其中包含的显著性信息与跨库识别性能有紧密联系.再引入Chirplet时频原子,通过形成的过完备原子库提高语谱图特征的信息量.来自多个数据库的样本具有多成分分布的特征,据此所提模型中的Chirplet扩大了特征向量在时频域上的尺度.实验结果显示,相比传统特征模型,所提方法性能有显著提升.此外,该方法在训练集和测试集来源不一致情况下具有更好的鲁棒性.
张昕然宋鹏查诚陶华伟赵力
关键词:语音情感识别
联合时频域中增强后耳语音的可懂度评估(英文)被引量:1
2014年
对在联合时频域影响增强后耳语音可懂度的因素进行了评估.分析了耳语音时频谱密度和增强后耳语音时频谱中不同区域对耳语音可懂度的影响.实验结果表明,在基于增益修正的时频域语音增强算法中,采用密度较高的耳语音谱可提高增强后耳语音可懂度.此外,在增强后的耳语音的时频谱中,频谱幅度小于干净耳语音时频谱的频谱区域对增强后的耳语音的可懂度提高最为重要,而那些频谱幅度大于2倍干净耳语音频谱的频谱区域对增强后的耳语音的可懂度具有消极作用.
周健魏昕梁瑞宇赵力
关键词:实值离散GABOR变换
一种自适应多通道响度补偿方法(英文)
2016年
为减小助听器系统中传统响度补偿方法中语音可听和畸变之间的矛盾,提出了一种自适应的多通道响度补偿方法.该方法根据带通信号的动态范围和患者的听阈交替使用线性方法和动态范围压缩方法.为进一步减小动态范围压缩引起的畸变,并提高噪声环境下的输出信噪比,给出了一种自适应调整压缩比的方法.实验结果表明,与WDRC动态范围压缩补偿方法相比,所提方法在语噪声环境下的输出信噪比至少提高了1.73 dB;与线性和动态范围压缩补偿方法相比,所提方法的平均语音可懂度分别提升了6.0%和5.7%.
王侠梁瑞宇王青云申红明赵力邹采荣
关键词:助听器
工作环境中的语音烦躁情绪检测方法(英文)
2013年
为了检测工作人员的烦躁情绪,实现情感状态的评价,通过在工作环境中诱发情感语音,获取了足够的测试样本,建立了2 000条样本的工作环境情感语音数据库.在检测烦躁情绪过程中,首先提取语音的韵律特征和音质特征参数,然后利用基于蛙跳算法的改进的BP神经网络进行烦躁情绪识别.实验比较了BP,RBF和SFLA神经网络的性能,结果显示SFLA神经网络的识别率比BP神经网络高4.7%,比RBF神经网络高4.3%.实验结果表明,使用蛙跳算法训练随机初始数据可以优化神经网络的连接权重和阈值,加快收敛速度,提高识别率.
王青云赵力梁瑞宇张潇丹
关键词:蛙跳算法
Cooperative Compressive Spectrum Sensing in Cognitive Underw ater Acoustic Communication Networks
2015年
Because of the specific of underwater acoustic channel,spectrum sensing entails many difficulties in cognitive underwater acoustic communication( CUAC) networks, such as severe frequency-dependent attenuation and low signal-to-noise ratios. To overcome these problems, two cooperative compressive spectrum sensing( CCSS) schemes are proposed for different scenarios( with and without channel state information). To strengthen collaboration among secondary users( SUs),cognitive central node( CCN) is provided to collect data from SUs. Thus,the proposed schemes can obtain spatial diversity gains and exploit joint sparse structure to improve the performance of spectrum sensing. Since the channel occupancy is sparse,we formulate the spectrum sensing problems into sparse vector recovery problems,and then present two CCSS algorithms based on path-wise coordinate optimization( PCO) and multi-task Bayesian compressive sensing( MT-BCS),respectively.Simulation results corroborate the effectiveness of the proposed methods in detecting the spectrum holes in underwater acoustic environment.
左加阔陶文凤包永强赵力邹采荣
基于改进的深度神经网络的说话人辨认研究
2017年
说话人辨认技术在许多领域有着广泛的应用前景。首先研究了两种基本的深度神经网络模型(深度信念网络和降噪自编码)在说话人辨认上的应用,深度神经网络通过逐层无监督的预训练和有监督的反向微调避免了反向传播容易陷入局部最小值的缺陷,通过实验证明了当神经元个数达到一定数量之后深度网络模型是优于普通BP网络的,并且其性能随着网络规模的扩大而提升。考虑到大规模的深度网络训练时间较长的缺点,提出使用整流线性单元(Re LU)代替传统的sigmoid类函数对说话人识别的深度模型进行改进,实验结果表明改进后的深度模型平均训练时间减少了35%,平均误识率降低了8.3%。
赵艳吕亮赵力
关键词:说话人辨认
共1页<1>
聚类工具0