您的位置: 专家智库 > >

徐燃

作品数:5 被引量:9H指数:1
供职机构:中国科学院声学研究所更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家科技支撑计划更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 2篇期刊文章
  • 2篇会议论文
  • 1篇学位论文

领域

  • 3篇电子电信
  • 3篇自动化与计算...

主题

  • 3篇语音
  • 2篇音频
  • 2篇语音识别
  • 2篇判据
  • 2篇贝叶斯
  • 1篇信号
  • 1篇信号处理
  • 1篇音频格式
  • 1篇音频格式转换
  • 1篇语音信号
  • 1篇语音信号处理
  • 1篇声学模型
  • 1篇声学特征
  • 1篇体育
  • 1篇体育节
  • 1篇体育节目
  • 1篇自动语音识别
  • 1篇节目
  • 1篇关键词检测
  • 1篇比赛

机构

  • 5篇中国科学院

作者

  • 5篇徐燃
  • 3篇潘接林
  • 2篇刘晓星
  • 1篇赵庆卫
  • 1篇颜永红

传媒

  • 1篇微计算机应用
  • 1篇计算机应用
  • 1篇第八届全国人...

年份

  • 2篇2009
  • 3篇2005
5 条 记 录,以下是 1-5
排序方式:
一种基于距离测算和贝叶斯信息判据的音频分段算法
本文提出的分段算法先使用距离测算的方法将音频流分为较为零碎的片段,再利用贝叶斯信息判据(BIC)对相邻的片段进行合并,力图使每一个音频片段中仅含有单一的声学特征.此算法在广播新闻语料和访谈性质的电话交谈中均取得了较好的效...
徐燃刘晓星潘接林
关键词:语音信号处理
文献传递
一种基于距离测算和贝叶斯信息判据的音频分段算法
音频流分段技术在语音识别的前端信号处理过程中有着重要的意义。好的音频分段算法应能根据说话人、信道等声学环境的变化对输入音频流进行分段,从而为后续的聚类和自适应过程做好准备。本文提出的分段算法先使用距离测算的方法将音频流分...
徐燃刘晓星潘接林
关键词:声学特征
文献传递
一种应用于体育节目中的关键词检测与比赛分类系统
2009年
提出一种应用于体育节目音频分析中的关键词检索系统框架,并利用关键词检索结果对比赛实现了体育类别的自动判断。采用一种基于距离测算和基于模型选择融合的前端音频处理模块,实现了对复杂音频流中语音的高效提取;采用基于LVCSR系统的关键词系统框架,利用少量体育节目语音数据,对声学模型进行了自适应,构建体育类语言模型同时提出一种针对特定关键词词频分布的语言模型自适应,较大幅度提高了关键词系统的检出性能;针对不同体育比赛选择特征关键词,并利用关键词系统检索结果实现了比赛类别的自动判定,在由七种体育共15场比赛构成的测试集中,判定正确率达到100%。
卢鲤徐燃赵庆卫颜永红
DirectShow技术在音频格式转换及音视频分离方面的应用被引量:8
2005年
目前语音识别系统的输入都是线性PCM格式的音频文件,然而在实际应用中,需要识别各种格式音频文件以及视频流中的音频,在开始识别前,需要进行音频格式转换并从视频流中进行音频提取。因此,音频格式的转换和从视频中分离出音频信号已成为语音识别系统一种必需的预处理过程。文中介绍了一种将M icrosoft的D irectShow技术应用于W indows平台的多种压缩音频格式转换为W indows PCM WAV格式以及从多媒体视频中分离音频信号的方法,并分析了常见音频压缩编码格式经转换后对语音识别系统性能的影响。这对于语音识别技术在实际中的应用有着重要的意义。
徐燃潘接林
关键词:DIRECTSHOW语音识别音频格式转换
自动语音识别中声学模型鉴别性训练的研究与应用
声学模型的鉴别性训练是近年来主流语音识别系统中所广泛采用的模型训练优化手段,相较于传统的声学模型最大似然估计训练,鉴别性训练对模型假设的依赖程度降低,通过优化与系统识别率相关的目标函数,在有限的训练集上力图从正反两方面的...
徐燃
共1页<1>
聚类工具0