您的位置: 专家智库 > >

林乐

作品数:2 被引量:11H指数:2
供职机构:南京邮电大学通信与信息工程学院更多>>
发文基金:江苏省博士后科研资助计划项目国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇动态时间规整
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇矢量
  • 1篇矢量量化
  • 1篇说话人
  • 1篇说话人识别
  • 1篇统计特性
  • 1篇向量
  • 1篇向量机
  • 1篇混合模型
  • 1篇高斯
  • 1篇高斯混合
  • 1篇高斯混合模型
  • 1篇DTW
  • 1篇GMM

机构

  • 2篇南京邮电大学

作者

  • 2篇李燕萍
  • 2篇林乐

传媒

  • 2篇计算机技术与...

年份

  • 2篇2017
2 条 记 录,以下是 1-2
排序方式:
基于DTW模型补偿的伪装语音说话人识别研究被引量:7
2017年
语音变声器及各种手机变声软件的出现,在提供了极其方便且丰富的娱乐交互体验的同时,也给语音通信带来了新的安全问题。由于其产生的电子伪装语音掩盖了语音本身的个性特征,对现有的说话人识别技术来说是一种挑战,且一旦被犯罪分子利用,后果将十分严重。因此,伪装语音说话人识别的研究成为当下的研究热点。提出一种针对电子伪装语音的说话人识别方法。对于由手机变声软件产生的电子伪装语音,提取该语音的梅尔倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)作为特征参数,通过动态时间规整(Dynamic Time Warping,DTW)模型进行伪装程度鉴定,再利用矢量量化(Vector Quantization,VQ)模型进行说话人识别,从而设计了DTW与VQ相结合的电子伪装语音说话人识别系统。实验结果表明:该系统能够有效解决VQ说话人识别系统对电子伪装语音识别率过低的问题,识别效果得到了明显改善。
李燕萍陶定元林乐
关键词:说话人识别动态时间规整矢量量化
基于GMM统计特性的电子伪装语音鉴定研究被引量:5
2017年
数字多媒体技术的发展使多媒体信息得到广泛使用和传播,给人类的信息交流带来极大的便利。随着语音相关技术的发展与逐渐成熟,对于语音信号处理的应用也越来越广泛。数字多媒体信息易于修改的特点,使其面临着恶意篡改带来的严重危机。近年来,手机应用软件市场上出现了大量的变声软件,例如微信变声器、超级变声器等等,类似变声器的下载量动辄上百万,这些应用软件可使说话人的声音发生巨大的改变,致使一般的听话人无法辨认发音人的身份、年龄乃至性别,即使是对话者非常熟悉的人也很难识别出说话者的身份。提出了一种鉴定电子伪装语音的方法,通过GMM模型建模,将其均值矢量构成组合特征,然后基于SVM分类器进行训练和鉴别。通过对比语音伪装前后的梅尔倒谱特征参数的统计特性变化,对特征参数的变化规律进行了分析研究。实验结果表明,提出的方法对电子伪装语音的鉴定正确率达到90%。
李燕萍林乐陶定元
关键词:支持向量机高斯混合模型
共1页<1>
聚类工具0