孙林慧 作品数:91 被引量:259 H指数:9 供职机构: 南京邮电大学 更多>> 发文基金: 国家自然科学基金 江苏省普通高校研究生科研创新计划项目 江苏省自然科学基金 更多>> 相关领域: 电子电信 自动化与计算机技术 文化科学 更多>>
一种基于两阶段瓶颈层特征选择和多分类器联合判决算法的语音情感识别方法 本发明揭示了一种基于两阶段瓶颈层特征选择和多分类器联合判决算法的语音情感识别方法,包括如下步骤:S1、提取傅里叶系数特征并输入深度神经网络,训练深度神经网络以提取瓶颈特征,得到深层瓶颈层特征及浅层瓶颈层特征;S2、对深层... 孙林慧 李秋 黄译庆 李平安文献传递 基于嵌套深度神经网络的语音情感识别方法和系统 本发明公开了一种基于嵌套深度神经网络的语音情感识别方法和系统,方法包括:构建MFCC数据集;基于深度神经网络构建语音情感识别模型,采用MFCC数据集对语音情感识别模型进行初步训练,遍历得到不同参数组对应的语音情感的识别率... 蔡芃芃 周茜璇 孙林慧 查亦文文献传递 说话人识别中测试时长与识别率关系研究 被引量:4 2005年 测试时长是影响说话人识别问题的主要因素之一。该文主要对分布式语音识别中测试时长与说话人识别率的关系进行了研究。文中采用文本无关的训练模板,首先对基本的说话人辨认系统用干净语音和带噪语音进行了测试,结果表明系统识别率随测试时长的增加而提高,并在实验室条件下获得加噪语音最佳测试时长。其次为了减小最佳测试时长采用改进的说话人辨认系统,先对说话人的性别进行分类然后再对其身份进行识别,不仅减少了测试所需的最佳时长,而且提高了系统的抗噪性能。最后对仿真结果进行了分析。 孙林慧 叶蕾 杨震关键词:分布式语音识别 说话人辨认 识别率 基于多领域统计特征和改进CNN的含噪语音情感识别方法 本发明提出了一种基于多领域统计特征和改进CNN的含噪语音情感识别方法,属于语音识别领域,包括以下步骤:步骤1:首先对语料库中的纯净语音进行加噪处理,其次提取语音信号的相关多领域特征,采用统计函数对已提取的特征进行筛选,降... 孙林慧 王舜 赵敏 叶蕾一种基于多头注意力机制和Bi-LSTM的复数去混响语音增强方法 本发明公开了一种基于多头注意力机制和Bi‑LSTM的复数去混响语音增强方法,属于语音增强技术领域。本发明在复数域进行去混响处理,首先将信号进行STFT变换得到复数谱,以充分地利用幅度和相位信息。然后将复数谱特征送入高级通... 孙林慧 丁兆伟 王春艳 李平安 叶蕾基于数据驱动字典和稀疏表示的语音增强 被引量:15 2011年 本文提出了一种基于数据驱动字典和过完备稀疏表示的自适应语音增强方法。首先在训练阶段采用干净语音基于K奇异值分解(K—singular value decomposition,K-SVD)算法训练过完备字典,然后在测试阶段根据含噪语音的噪声方差自适应选择最优的阈值,采用正交匹配追踪算法对含噪语音信号在过完备字典上进行稀疏分解,最后利用系数稀疏表示重构语音信号,从而达到语音增强的目。该方法不像传统语音增强方法那样减少或消去噪声,而是从字典中选取适当的原子表示纯净信号,从而把纯净信号从含噪信号中分离出来。对白噪声和有色噪声环境下重构语音进行了主客观评价。仿真结果显示:该方法能有效去除加性噪声,并且改善了语音质量。 孙林慧 杨震关键词:语音增强 正交匹配追踪 基于DNN与GMM模型的说话人识别方法 本发明揭示了一种基于DNN与GMM模型的说话人识别方法,包括如下步骤:在给定特征参数MFCC的前提下,基于GMM‑SVM提取超矢量实现数据降维,并拟构建相关超矢量来提取携带更丰富的说话人身份信息的特征;构造深度信念网络体... 孙林慧 顾婷一种基于Transformer模态内感知和模态间交叉融合的多模态情感识别方法 本发明公开了一种基于Transformer模态内感知和模态间交叉融合的多模态情感识别方法,步骤包括:首先,对语音和文本进行编码提取深度特征,然后基于本发明提出的基于Transformer的模态内感知模块,捕获各个模态内部... 孙林慧 苏继绮 王静 李平安 叶蕾毕业设计中培育学生机器学习知识和创新能力 2021年 为应对"双一流"背景下培养拔尖创新人才的需求,积极落实《江苏教育信息化2.0行动计划》,以南京邮电大学电子信息类专业学生为例,依据笔者实践经验首先总结了目前毕业设计存在的问题,然后探索了依托毕业设计培育大学生机器学习知识和创新能力新模式.本文主要从提倡以学习者为中心,开发多视角解决问题的课题,进行差异性选题,加强线上指导和团队建设,适当考核学生创新能力等方面进行了探讨. 孙林慧 李平安一种含噪声语音信号压缩感知方法 本发明提出了一种含噪声语音信号压缩感知方法,所述方法包含训练和实测两个阶段,训练阶段针对语音信号,进行压缩采样重构训练,得到含噪语音信号的拉格朗日乘子形式重构算法中的最佳调整参数;实测阶段在发端对含噪声语音信号压缩采样,... 孙林慧 杨震文献传递