您的位置: 专家智库 > >

甄斌

作品数:2 被引量:183H指数:2
供职机构:北京大学信息科学中心更多>>
发文基金:北京市自然科学基金国家自然科学基金中国博士后科学基金更多>>
相关领域:电子电信更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇电子电信

主题

  • 2篇语音
  • 2篇语音识别
  • 1篇倒谱
  • 1篇信号
  • 1篇语音信号
  • 1篇噪声
  • 1篇说话人识别
  • 1篇加性噪声
  • 1篇MFCC

机构

  • 2篇北京大学

作者

  • 2篇甄斌
  • 2篇吴玺宏
  • 1篇迟惠生
  • 1篇刘志敏

传媒

  • 1篇声学学报
  • 1篇北京大学学报...

年份

  • 2篇2001
2 条 记 录,以下是 1-2
排序方式:
语音识别和说话人识别中各倒谱分量的相对重要性被引量:176
2001年
采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度 ,在标准英文数字语音库上的实验表明 ,最有用的语音信息包含在MFCC分量C1到C12 之间 ,最有用的说话人信息包含在MFCC分量C2 到C16之间。MFCC分量C0 和C1包含有负作用的说话人信息 ,将其作为特征会引起识别率的降低。
甄斌吴玺宏刘志敏迟惠生
关键词:MFCC说话人识别语音识别
语音信号的增强相对谱滤波被引量:7
2001年
提出了在语音信号对数功率谱域和功率谱域顺序滤波的新的增强RASTA滤波(ERASTA)方法。语音识别和说话人识别实验表明,ERASTA滤波能够有效地去除加性噪声和卷积噪声的干扰,ERASTA算法与语音信号的失真过程和噪声的功率谱无关。ERASTA方法性能同JRASTA算法类似或更好,且不需要JRASTA 算法中的实时语音信噪比估计。ERASTA 滤波器的设计表明,低频率的谱调制分量可引起语音识别和说话人识别性能的下降,说话人识别较语音识别需要较小的谱时间调制带宽。
甄斌吴玺宏刘志敏迟惠生
关键词:语音信号加性噪声语音识别
共1页<1>
聚类工具0