许一震
- 作品数:9 被引量:187H指数:6
- 供职机构:上海交通大学电子信息与电气工程学院计算机科学与工程系更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 一种面向新闻文献的自动摘要系统的研究与实践被引量:4
- 2000年
- 主要介绍了一种面向新闻文献的自动摘要系统的研究与实践.阐述了面向新闻文献的自动摘要原理,在建立新闻文献主题提取规则库过程中的几点体会,又简要地介绍了系统的流程,最后给出了对该系统进行大规模黑箱测试的结果.评测结果显示该系统已经基本成熟,可以用于实际应用中.
- 沈洲王永成许一震吴芳芳
- 关键词:自然语言处理自动摘要系统
- 一种面向中文的快速字串多模式匹配算法被引量:20
- 2001年
- 针对中文字串匹配问题 ,提出一种快速多模式匹配算法 .算法采用新型组合状态自动机 ,将2个状态组合起来匹配一个双字节字符 ,从而解决了双字节字符构建完全 Hash表时带来的存储空间膨胀问题 ;同时考虑到待匹配模式串中的字符在大字符集中呈稀疏分布的特点 ,尝试将单模式QS匹配算法的思想与 DFSA算法进行结合 ,应用于多模式匹配中 .实验结果显示 ,本算法明显优于 DFSA算法 ,平均所花费时间仅为 DFSA算法的 45 .2 % .
- 沈洲王永成许一震
- 关键词:字符串有限状态自动机多模式匹配
- 英文文献主题概念的自动提取被引量:6
- 2001年
- 提出了一种基于概念的英文文献主题提取法。该方法的主要特点是运用义类词典Wordnet作为知识库,分析词汇之间的概念关系。实验结果表明,这种方法提取的主题更接近于手工标引,并且由于使用统计方法,实现简单,速度较快。
- 吴芳芳王永成许一震
- 关键词:WORDNET文摘
- 一种快速的多模式字符串匹配算法被引量:50
- 2002年
- 以基于有限自动机的多模式匹配算法 (DFSA)为基础 ,结合 Boyer- Moore(BM)和 QuickSearch (QS)快速单模式匹配算法的优点 ,提出了一种快速的多模式字符串匹配算法 .在一般情况下 ,该算法不需要匹配目标文本串中的每个字符 ,能充分利用匹配过程中本次匹配不成功的信息和已经匹配成功的信息 ,跳过尽可能多的字符 .实验表明 ,模式串较短时 ,本算法所需时间为 DFSA算法的 1 /2~ 1 /3 ;模式串较长时 ,其所需时间为 DFSA算法的 1 /3~ 1
- 许一震王永成沈洲
- 关键词:字符串有限自动机多模式匹配信息处理
- 自动文摘系统评价方法的研究与实践被引量:24
- 2001年
- 自动文摘系统作为一种信息压缩精选工具 ,越来越引起人们广泛的兴趣。但是 ,目前仍未有一种客观公认的评价方法来对已有的系统进行评价 ,从而极大地阻碍了自动文摘领域的研究。本文首先阐述了自动文摘系统评价所面临的问题 ,随后综述了当前国内外自动文摘的评价方法 。
- 沈洲王永成许一震方澈
- 关键词:自然语言处理自动文摘系统
- 改进的多模式匹配算法被引量:95
- 2002年
- 在有限自动机的多模式匹配算法 (DFSA算法 )的基础上 ,结合 Quick Search算法的优点 ,提出了一个快速的多模式字符串匹配算法 .之后在算法中以连续跳跃的思想 ,给出了另一个更加有效的改进 .在一般情况下 ,这两个算法不需要匹配目标文本串中的每个字符 ,并充分利用了匹配过程中本次匹配不成功的信息 ,跳过尽可能多的字符 .在模式串较长和较短的情况下 ,算法都有很好的性能 .实验表明 ,在模式串较短时 ,所提出的算法需要的匹配时间仅为 DFSA算法的 1/2到 1/5 ,在模式串较长时 ,所需时间为 DFSA算法的 1/3至
- 王永成沈州许一震
- 关键词:算法复杂度多模式匹配算法有限自动机计算机
- 报道型自动摘要中若干关键技术的研究
- 报道型自动摘要通过对文献进行全面的结构分析和对摘要句的改造,实现能比较全面地反映主题和更加简洁的摘要.报道型自动摘要不仅要解决好文献主题与知识信息自动提取的问题,而且要解决好文摘句的自动生成问题.该论文以报道型自动摘要的...
- 许一震
- 关键词:信息抽取自然语言处理
- 文献传递
- 一种基于反向有限自动机的匹配算法被引量:8
- 2001年
- 根据中文信息处理的需要 ,把传统的有限自动机改造成了反向有限自动机。讨论了利用反向有限自动机进行多模式的匹配 ,并给出了形式化的算法。通过比较 。
- 许一震王永成吴芳芳
- 关键词:自动机字符串中文信息处理
- 小标题识别的意义和方法被引量:3
- 2002年
- 介绍了小标题识别在中文信息处理领域中的重要意义,提出了用正规式和自动机理论进行有标号小标题识别的方法。
- 刘功申王永成许一震
- 关键词:中文信息处理二义性计算机