邵艳秋
- 作品数:25 被引量:81H指数:7
- 供职机构:北京城市学院更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划教育部重点实验室开放基金更多>>
- 相关领域:自动化与计算机技术电子电信自然科学总论语言文字更多>>
- 高自然度汉语语音合成韵律预测技术研究
- 随着多媒体通信技术的不断发展,作为人机通信重要方式之一的语音合成技术以其方便、快捷的优点受到了研究者的广泛关注。语音合成的目标是使合成的语音可懂、清晰、自然而富有表现力。目前汉语语音合成已经很好地解决了清晰度和可懂度的问...
- 邵艳秋
- 关键词:汉语语音合成
- 文献传递
- 语义词典归类不当现象自动发现
- 2011年
- 平行周遍原则是陈保亚(1999)提出的一种用于区分词与短语的理论,将词语分为既平行又周遍、平行不周遍和不平行不周遍三类,既平行又周遍的是短语,不宜收入词典。由于汉语语义词典在收词时并未严格遵循平行周遍原则,因此依据现有语义词典可以自动地归纳出许多平行周遍规则或者平行不周遍规则。假定有两部语义词典,则可以归纳出两套平行(不)周遍规则,每一套规则都有各自的正例和反例。一个词典中某一规则的反例如果同时是另一词典中的正例,就意味着前一部词典中的词语可能归类不当。基于这一思路,该文提出一个基于平行周遍原则的语义词典归类不当现象自动发现方法,实验结果证明了这一方法的有效性。
- 邱立坤邵艳秋
- 关键词:语义词典
- 基于依存分析的汉语文语转换停顿指数自动标注研究
- 不同的停顿指数可以将文本切分成适合朗读与理解的韵律组块,从而保证合成语音能够以自然的节奏表现出来。目前的停顿指数标注所采用的特征绝大多数都是较为浅层的词法特征如词性,词长等。本文利用依存句法分析的结果,抽取出若干同停顿指...
- 邵艳秋韩纪庆刘挺赵永贞
- 关键词:语音合成依存分析语法结构
- 文献传递
- 汉语文语转换系统中停顿指数的自动标注被引量:8
- 2004年
- 本文采用了一个基于C TOBI的停顿指数标注的语料库 ,利用有指导的学习方法对自动停顿指数标注方面做了一些有益的探索。本文共实现了三种方法 :基本的马尔科夫模型 ,引入了词长信息的马尔科夫模型 ,引入词长信息的马尔科夫模型结合基于转换的错误驱动的学习方法。然后通过对 30 0 0句的真实文本进行开放测试 ,以基本的马尔科夫模型的结果作为基准 ,实验结果不断改进 ,最终达到了 78 6 %的准确率 ,错误代价降低了 14 5 %
- 赵永贞刘挺王志伟陈惠鹏邵艳秋
- 关键词:计算机应用中文信息处理文语转换马尔科夫模型
- 面向自动文摘的文本结构划分被引量:3
- 2008年
- 文本结构划分是自动文摘研究中的一个关键阶段,也是自然语言处理领域的重要课题.本文通过构建段落向量空间模型,提出一种综合考察相邻段落相似度和连续段落平均相似度的意义段划分方法,使文摘内容更加全面,结构更加平衡.实验结果表明,该方法能够较有效地反映文章的内容结构,对有子标题组织和无子标题组织的文章均适用;由于考虑了总起段,使得文本结构划分更加合理,为自动文摘系统的后续工作打下坚实的基础.
- 朱荷香曲维光卢俊之李素建邵艳秋
- 关键词:文本结构自动文摘向量空间模型
- 信息检索相关术语被引量:3
- 2009年
- 信息检索技术是计算机技术和传统图书情报技术相结合而产生的新技术,在互联网高速发展的今天有着重要的应用。本文介绍了信息检索的发展历史及其相关术语,包括信息检索、搜索引擎、信息提取、信息过滤以及两个常用的信息检索系统性能评价指标:准确率和召回率。
- 邵艳秋
- 关键词:信息检索搜索引擎信息提取信息过滤准确率召回率
- 韵律参数和频谱包络修改相结合的情感语音合成技术研究被引量:8
- 2007年
- 情感语音合成可以增强合成语音的表现力、人情味,是近年来的新兴课题。除了韵律特征之外,音质类和发声器官类参数对情感语音的表达也有着至关重要的影响,而通常的研究大多都是基于规则或者预先为某种情感设计的滤波器来进行这两类参数的修改。本文提出了通过频谱包络综合地调整音质类和发声器官类参数来合成情感语音的方法,并通过实验验证了这一方法的有效性。另外,实验结果也显示了当韵律参数和频谱包络同时得到修改时,相对于单独修改某类参数可以获得更好的情感合成效果。
- 邵艳秋韩纪庆王卓然刘挺
- 关键词:情感语音合成
- 汉语文语转换系统中停顿标注的研究
- 本文采用了一个基于C-TOBI的停顿标注等级的语料库,并使用概率统计模型的方法对自动停顿标注方面做了一些有益的探索。首先对样本集进行自动分词和词性标注,接着统计训练集中不同的词性组合和短语长度处停顿的概率信息;然后利用得...
- 赵永贞刘挺王志伟陈惠鹏邵艳秋
- 关键词:文语转换HMM模型
- 文献传递
- 基于依存分析的汉语文语转换停顿指数自动标注研究
- 不同的停顿指数可以将文本切分成适合朗读与理解的韵律组块,从而保证合成语音能够以自然的节奏表现出来。本文利用依存句法分析的结果,抽取出若干同停顿指数相关的深层句法特征,实验证明,其中内弧跨度和内弧类型等特征对浅层特征较难解...
- 邵艳秋韩纪庆刘挺赵永贞
- 关键词:语音合成语法结构
- 文献传递
- 汉语文语转换中韵律词自动切分的研究
- 本文提出了一种基于隐马尔科夫模型(HMM)的汉语韵律词自动切分方法,同时还设计了一种基于统计的词内切分模型对HMM方法的切分结果做进了一步处理,提高了召回率,最后将基于错误驱动的方法应用于前面的结果,使切分的准确率又有了...
- 邵艳秋赵永贞韩纪庆刘挺
- 关键词:语音合成文语转换
- 文献传递