国家自然科学基金(60975017)
- 作品数:24 被引量:72H指数:4
- 相关作者:赵力邹采荣王吉林卞金洪周锋更多>>
- 相关机构:东南大学盐城工学院南京工程学院更多>>
- 发文基金:国家自然科学基金江苏省自然科学基金广东省自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术语言文字更多>>
- 基于曲线波隐马尔可夫模型的人脸检测被引量:3
- 2011年
- 提出了一种基于曲线波隐马尔可夫模型的混合人脸检测算法。曲线波变换是一种多尺度几何变换,具有很好的方向性,能用极少的非零系数精确表示图像的边缘,是一种最稀疏的表示方法。根据隐马尔可夫模型对人脸拓扑结构的约束,采用3状态的隐马尔可夫模型进行从粗到细的人脸检测。实验结果表明,这种算法具有较好的检测速度与正确率及鲁棒性。
- 王吉林叶建隆赵力邹采荣
- 关键词:人脸检测
- 基于JND和AR模型的感知视频编码方法(英文)被引量:1
- 2010年
- 为了达到减少比特数同时保持画面质量的目的,提出了一种基于最小可视失真(JND)和自回归(AR)模型的感知视频编码方法.首先,设计了基于JND的纹理分割算法,建立了空时JND模型,以MB为基本单元,通过计算其JND能量并与阈值做比较,用以分割出视频序列中的纹理区域.然后,开发了AR模型来合成纹理区,在使用最小二乘法计算出AR模型的参数后,用相邻的前后参考帧对应像素的线性插值来生成重构像素.最后,为了检验所提方法的效果,将其与H.264/AVC视频编码系统做比较,用不同的视频序列实验来验证所提方法的有效性.实验结果显示,对于具有不同纹理特点的实验序列,所提方法可以在保持感知质量的同时将比特率减少15%~58%.
- 王翀赵力邹采荣
- 关键词:纹理合成AR模型
- 用于语音转换的有效基音频率转换算法(英文)
- 2012年
- 为了改善语音转换的性能,对基音频率转换方法进行了研究,并提出了一种有效的转换算法. 首先,不同于传统的线性变换方法,对基音频率和频谱特征的内在关系进行了分析,在 GMM 中的每一分量,基音频率通过 SVR 方法从转换后的频谱特征预测得到. 然后,为了缓解 GMM 统计平均带来的过平滑问题,将传统的均值-方差转换方法和 SVR 方法相结合. 同时,引入广泛应用于图像处理的自适应中值滤波来解决由基于帧转换引起的不连续问题. 通过主客观评价方法对转换后的语音质量进行了测试,结果表明: 该方法无论在语音的相似度还是转换语音的质量上,都取得了比传统方法更好的效果.
- 宋鹏金赟包永强赵力邹采荣
- 关键词:支持向量回归自适应中值滤波
- 一种基于二代曲波系数乘积的图象去噪方法
- 2011年
- 曲线波变换是一种多尺度变换,对于具有光滑曲线奇异性的目标函数,曲线波提供了稳定的、高效的和近于最优的表示.在第二代曲线波的基础上,利用曲线波分解中不同尺度的系数也具有相同的特点,提出了基于第二代曲波的系数乘积去噪算法.实验结果表明,提出的算法明显优于小波图像去噪方法,也优于曲线波的阈值方法.
- 卞金洪周锋赵力
- 关键词:小波多尺度图像去噪
- 基于韵律变换的情感说话人识别(英文)被引量:1
- 2011年
- 为了解决由情感变化引起的说话人识别性能下降问题,提出了一种新的情感说话人识别系统. 首先,通过引入情感识别作为前端处理模块,对中性语音和情感语音进行分类. 然后,对情感语音进行韵律修正,分别采用高斯归一化、高斯混合模型( GMM) 和支持向量回归( SVR) 等方法建立情感语音和中性语音的基频映射规则,并根据平均线性变化率对时长进行了修正. 最后,对韵律修正后的情感语音进行识别. 实验结果表明,提出的情感说话人识别系统可以有效地提高情感说话人识别的性能,识别率相比传统方法有了显著的提高. 并且通过基频和时长修正的情感语音更接近于中性语音.
- 宋鹏赵力邹采荣
- 关键词:情感识别说话人识别
- 一种改进的基于自适应时频分解的实值离散Gabor变换算法
- 本文将自适应时频变换思想应用到实值离散Gabor变换中,提出了一种改进的基于自适应时频表示的实值离散Gabor变换算法,在该算法中无须计算双正交窗函数,从而大大扩展了实值离散Gabor变换算法的应用范围。实验结果表明,本...
- 周健陶亮
- 关键词:实值离散GABOR变换信号重建
- 文献传递
- 认知水声通信中的分布式压缩频谱感知算法(英文)被引量:2
- 2012年
- 在认知水声通信中,频谱感知是动态频谱接入和动态频谱共享的基础.相比于陆地环境,水下环境变化剧烈:如严重的频率选择性衰落、低的声波传播速度和多径效应等.因此,许多可用于认知无线电的频谱感知算法不能直接用于认知水声通信.除此之外,水下用户或节点均用电池供电,而基于融合中心(融合中心可能与感知用户相隔很远)的频谱感知算法需要将各个感知用户的感知数据传送到融合中心,由于功率受限并且计算资源有限,该方法几乎是不可行的.类似于无线通信系统,水声通信系统中的频谱使用率也很低,这使得水声通信信号在频域是稀疏的.研究结果表明,压缩感知算法可以有效的恢复稀疏信号.基于此,为了克服前述困难,本文提出了分布式压缩频谱感知算法.在该算法中,多个认知用户通过协作的方式获得空间分集增益来克服水声信道的严重衰落,并利用联合稀疏性来增强恢复稀疏信号的能力.通过分布式计算,该算法将协作频谱感知转化为去中心的局部优化问题,对于每个感知用户而言,只需要与其相邻的感知用户进行数据交互,这大大减少了每个感知用户的计算量和传输数据所需的功率消耗.本文对所提出的算法进行了仿真,并与其他算法进行了比较.实验结果证明了本算法在认知水声通信中检测频谱的有效性.
- 左加阔包永强赵力邹采荣陶文凤
- 关键词:频谱感知压缩感知分布式计算
- 织物图像增强技术的研究被引量:2
- 2011年
- 对具有不同特性的织物数字图像利用二维离散傅立叶变换进行图像增强和图像复原等操作,能有效地改善图像的质量,突出所需要的细节,为织物密度的自动测量提供最佳质量的图像。研究了二维离散快速傅立叶变换算法,以及利用该算法在频率域中进行图像增强和图像复原的新方法。实验结果分析表明,利用提出的方法可以较好地改善织物图像的质量。
- 张素贞叶建隆邹采荣
- 关键词:图像增强图像复原傅里叶变换频率域
- 基于图像亚像素处理的电缆护套厚度精确测量被引量:4
- 2011年
- 基于图像亚像素定位的精密测量系统是一个很有应用前景的研究方向。文中着重分析了影响测量系统精度的几大因素:彩色图像亮度信息的完整采集、图像梯度值计算精度、多类型边缘亚像素重定位精度。然后提出了综合应用主轴分析、多尺度梯度、通用亚像素重定位等方法,设计出适合做电缆护套厚度检测的简单有效算法流程。
- 周锋卞金洪赵力
- 基于噪声鲁棒性特征和SVM的耳语音可懂度增强(英文)被引量:2
- 2012年
- 提出了一种基于机器学习的耳语音可懂度增强方法.该方法利用已经训练好的2类支持向量机来估计一个二元时频掩蔽值,进而合成增强后的耳语音.输入支持向量机的特征向量GFCCs是基于听觉外周模型进行提取的,具有噪声鲁棒特性.在增强仿真实验中,将该算法同传统语音增强算法进行语音可懂度增强性能比较.客观评价和主观听力实验结果均表明,所提出的方法能有效提高含噪耳语音的听觉可懂度;相比谱减法和log-MMSE方法在低信噪比时无法提高语音可懂度,该方法在低信噪比时仍可有效提高含噪耳语音的听觉可懂度.此外,含噪耳语音通过所提出的方法进行增强后,其可懂度比未增强时明显提高.
- 周健赵力梁瑞宇方贤勇
- 关键词:耳语音