周琳 作品数:113 被引量:136 H指数:6 供职机构: 东南大学 更多>> 发文基金: 国家自然科学基金 江苏省自然科学基金 国家重点基础研究发展计划 更多>> 相关领域: 电子电信 自动化与计算机技术 医药卫生 文化科学 更多>>
一种基于迭代结构的双耳混合语音分离方法 本发明公布了一种基于迭代结构的双耳混合语音分离方法。利用双耳空间线索,耳间时间差ITD(Interaural Time Difference)和耳间强度差IID(Interaural Intensity Differen... 周琳 李楠 束佳明 吴镇扬文献传递 基于BP神经网络的双耳声源定位方法 本发明公开了一种基于BP神经网络的双耳声源定位方法,本发明提取出双耳声信号的互相关函数与耳间强度差作为特征参数,用反向传播BP神经网络对特征参数进行建模。测试过程中根据测试双耳声信号的互相关函数和耳间强度差,利用神经网络... 周琳 王立杰 庄琰 李楠文献传递 一种基于掩膜映射和混合空洞卷积网络的语音增强方法 本发明公开了一种基于掩膜映射和混合空洞卷积网络的语音增强方法。本方法在训练阶段,预处理后的含噪语音信号进行短时傅里叶变换,得到对数功率谱,同时计算理想比值掩膜。将若干帧的对数功率谱组成二维对数功率图谱,作为混合空洞卷积网... 周琳 陈惜金 吴超燕 钟秋月基于声场景判别的助听器自验配方法 本发明公开了一种基于声场景判别的助听器自验配方法。首先获取患者用户数据,利用所提的相似度匹配算法和优化后的声场景判别算法来精准匹配与患者相似的以往患者参数群,作为该患者的子参数群。其次,针对子参数群做抽样对比操作,根据每... 杨阳 邹采荣 郭如雪 周琳 鞠梦洁 王婕基于保留部分频域镜像分量的声源定位算法 被引量:1 2016年 针对传统的SRP-PHAT(Steered Response Power with Phase Transform)声源定位算法容易受噪声影响而导致定位性能降低的问题,提出一种频域补零且保留部分镜像分量的改进算法。该算法首先通过傅里叶变换将接收信号变换到频域,然后在高频端补零至20倍帧长,同时保留部分镜像分量。在此基础上计算麦克风对接收信号的互功率谱密度函数,作傅里叶逆变换得到相位变换加权的广义互相关(GCC-PHAT)函数。保留的镜像分量拓宽了信号频域,使GCC-PHAT函数的峰更为尖锐,累加后得到的SRPPHAT函数的空间谱峰也就更加尖锐,从而提高定位性能。实验表明,相比于传统算法,改进算法能显著提高定位成功率。 蔡卫平 刘瑞娟 周琳关键词:相位变换 声源定位 一种基于子带信噪比估计的双耳声源定位方法 一种基于子带信噪比估计的双耳声源定位方法,为一种改进的声源定位方法,将各方位耳间时间差ITD(Interaural Time Difference)的均值作为声源方位的定位特征线索,建立方位映射模型;实际声源定位时,输入... 周琳 周菲菲 吴镇扬基于深度特征的目标跟踪算法 被引量:6 2017年 针对跟踪过程中运动目标的鲁棒性问题,提出了一种基于深度特征的跟踪算法.首先,利用仿射变换对每一帧图像进行归一化处理.然后,利用深度去噪自编码器提取归一化图像的特征.由于提取的特征维数巨大,为了提高计算效率,提出了一种高效的基于稀疏表示的降维方法,通过投影矩阵将高维特征投影到低维空间,进而结合粒子滤波方法完成目标跟踪.最后,将初始帧的目标信息融入到目标表观更新过程中,降低了跟踪过程中目标发生漂移的风险.实验结果表明,所提出的视觉跟踪算法在6段视频序列上获得了较高的准确度,能够在遮挡、光照变化、尺度变化和目标快速运动的条件下稳定地跟踪目标. 程旭 张毅锋 刘袁 崔锦实 周琳关键词:视觉跟踪 一种基于卷积和循环融合网络的语音增强方法 本发明公布了一种基于卷积和循环融合网络的语音增强方法。训练阶段,对含噪语音和纯净语音分帧、加窗、短时傅里叶变换,提取含噪语音的对数幅度谱图,作为卷积和循环融合网络的输入特征,训练目标为理想比值掩膜矩阵,通过反向传播算法训... 程云苓 周琳 邓宇汐 王启瑞 曹焱翔 庄程浩 王天仪基于双耳语音分离和丢失数据技术的鲁棒语音识别算法 被引量:10 2019年 鲁棒语音识别技术在人机交互、智能家居、语音翻译系统等方面有重要应用。为了提高在噪声和语音干扰等复杂声学环境下的语音识别性能,基于人耳听觉系统的掩蔽效应和鸡尾酒效应,利用不同声源的空间方位,提出了基于双耳声源分离和丢失数据技术的鲁棒语音识别算法。该算法首先根据目标语音的空间方位信息,在双耳声信号的等效矩形带宽(EquivalentRectangularBandwidth,ERB)子带内进行混合语音信号的分离,从而得到目标语音的数据流。针对分离后目标语音在频域存在频谱数据丢失的问题,利用丢失数据技术修正基于隐马尔科夫模型的概率计算,再进行语音识别。仿真实验表明,由于双耳声源分离方法得到的目标语音数据去除了噪声和干扰的影响,所提出的算法显著提高了复杂声学环境下的语音识别性能。 周琳 赵一良 朱竑谕 汤一彬关键词:空间听觉 误识率 一种基于双层GMM结构和VTS特征补偿的孤立词识别方法 本发明公开了一种基于双层GMM结构和VTS特征补偿的孤立词识别方法,包括训练阶段和识别阶段,训练阶段中通过对纯净环境下的语音特征提取,获得两个GMM训练模型和一个HMM训练模型。其中GMM模型分别为含有个数较少的高斯混合... 周琳 李海静 吕勇 吴镇扬文献传递