徐燃
- 作品数:5 被引量:9H指数:1
- 供职机构:中国科学院声学研究所更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 一种基于距离测算和贝叶斯信息判据的音频分段算法
- 本文提出的分段算法先使用距离测算的方法将音频流分为较为零碎的片段,再利用贝叶斯信息判据(BIC)对相邻的片段进行合并,力图使每一个音频片段中仅含有单一的声学特征.此算法在广播新闻语料和访谈性质的电话交谈中均取得了较好的效...
- 徐燃刘晓星潘接林
- 关键词:语音信号处理
- 文献传递
- 一种基于距离测算和贝叶斯信息判据的音频分段算法
- 音频流分段技术在语音识别的前端信号处理过程中有着重要的意义。好的音频分段算法应能根据说话人、信道等声学环境的变化对输入音频流进行分段,从而为后续的聚类和自适应过程做好准备。本文提出的分段算法先使用距离测算的方法将音频流分...
- 徐燃刘晓星潘接林
- 关键词:声学特征
- 文献传递
- 一种应用于体育节目中的关键词检测与比赛分类系统
- 2009年
- 提出一种应用于体育节目音频分析中的关键词检索系统框架,并利用关键词检索结果对比赛实现了体育类别的自动判断。采用一种基于距离测算和基于模型选择融合的前端音频处理模块,实现了对复杂音频流中语音的高效提取;采用基于LVCSR系统的关键词系统框架,利用少量体育节目语音数据,对声学模型进行了自适应,构建体育类语言模型同时提出一种针对特定关键词词频分布的语言模型自适应,较大幅度提高了关键词系统的检出性能;针对不同体育比赛选择特征关键词,并利用关键词系统检索结果实现了比赛类别的自动判定,在由七种体育共15场比赛构成的测试集中,判定正确率达到100%。
- 卢鲤徐燃赵庆卫颜永红
- DirectShow技术在音频格式转换及音视频分离方面的应用被引量:8
- 2005年
- 目前语音识别系统的输入都是线性PCM格式的音频文件,然而在实际应用中,需要识别各种格式音频文件以及视频流中的音频,在开始识别前,需要进行音频格式转换并从视频流中进行音频提取。因此,音频格式的转换和从视频中分离出音频信号已成为语音识别系统一种必需的预处理过程。文中介绍了一种将M icrosoft的D irectShow技术应用于W indows平台的多种压缩音频格式转换为W indows PCM WAV格式以及从多媒体视频中分离音频信号的方法,并分析了常见音频压缩编码格式经转换后对语音识别系统性能的影响。这对于语音识别技术在实际中的应用有着重要的意义。
- 徐燃潘接林
- 关键词:DIRECTSHOW语音识别音频格式转换
- 自动语音识别中声学模型鉴别性训练的研究与应用
- 声学模型的鉴别性训练是近年来主流语音识别系统中所广泛采用的模型训练优化手段,相较于传统的声学模型最大似然估计训练,鉴别性训练对模型假设的依赖程度降低,通过优化与系统识别率相关的目标函数,在有限的训练集上力图从正反两方面的...
- 徐燃