肖欣延
- 作品数:11 被引量:17H指数:3
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 统计机器翻译短语抽取方法
- 本发明提供一种统计机器翻译短语抽取方法,包括下列步骤:1)从两个方向对双语语料获得多个对齐句对组合,并计算所述多个对齐句对组合的先验概率;2)由所述多个对齐句对组合的词语对的先验概率之和计算所述词语对的对齐概率,由所述词...
- 刘洋夏天肖欣延刘群
- 一种新的Web检索结果聚类方法
- Web检索结果聚类用于检索结果的组织,以方便用户的浏览.从一个新的角度审视检索结果聚类.通过分析检索结果的特点,由此提出计算检索结果中的词语与用户输入的关键词的共现程度,然后根据共现程度高的词语确定墓类,最后利用类标签的...
- 肖欣延张东站高君杰薛永生
- 关键词:聚类搜索引擎语义聚类WEB检索
- 文献传递
- 统计机器翻译短语抽取方法
- 本发明提供一种统计机器翻译短语抽取方法,包括下列步骤:1)从两个方向对双语语料获得多个对齐句对组合,并计算所述多个对齐句对组合的先验概率;2)由所述多个对齐句对组合的词语对的先验概率之和计算所述词语对的对齐概率,由所述词...
- 刘洋夏天肖欣延刘群
- 文献传递
- 面向层次短语翻译的词汇化调序方法研究被引量:6
- 2012年
- 词汇化信息在短语调序中有重要的作用。然而层次短语翻译模型调序时并不考虑变量所泛化的短语的词汇化信息,因此该模型调序的歧义性较大。为此该文提出面向层次短语模型的词汇化调序方法。我们定义变量与邻接词语的调序关系,并使用变量所泛化短语片段的边界词信息来指导调序。在大规模语料的汉语到英语翻译评测任务中,我们的方法在NIST 2003-2005测试数据上获得了0.6~1.2BLEU值的提高。
- 肖欣延刘洋刘群林守勋
- 关键词:统计机器翻译
- 基于免疫和模糊逻辑的自适应入侵检测
- 随着网络入侵方法和网络计算环境的变化,入侵越来越难以被检测和防范.本文针对当前入侵检测中存在的问题给出了一种基于生物免疫机制和模糊逻辑的自适应入侵检测模型, 分别对正常行为模式和待检测行为模式建立模糊关联规则集,通过比较...
- 高君杰张东站肖欣延薛永生
- 关键词:入侵检测人工免疫模糊逻辑自适应模型
- 文献传递
- 文本生成技术及其在百度产品中的应用被引量:1
- 2018年
- 文本生成技术是人工智能领域的重要课题,在语音搜索和语音对话中应用广泛。依据输入的不同,文本生成技术主要包括两类:数据到文本生成和文本到文本生成。数据到文本生成是指将包含键值对的数据转化为自然语言文本;文本到文本生成对输入文本进行转化和处理从而产生新的文本,其典型的子技术有序列到序列的文本生成、文档摘要技术。百度产品中融合、应用了大量文本生成技术,让用户获取信息更加简单便捷。
- 肖欣延肖欣延吴甜
- 关键词:结构化数据搜索结果
- 基于词汇链和PageRank的多文档自动文摘研究
- 随着网络信息的剧增,网络上的信息重复性很大。同一主题的相关文档通常是成千上万,它们的内容相似,但又有所不同,各有侧重点。人们迫切需要一种能够以简洁连贯的语言提供同一主题的多文档集合中全面而重要的信息的工具,多文档自动文摘...
- 肖欣延
- 关键词:自动文摘词汇链多文档文摘文本处理
- 文献传递
- 基于免疫和模糊逻辑的自适应入侵检测被引量:1
- 2007年
- 随着网络入侵方法和网络计算环境的变化,入侵越来越难以被检测和防范.本文针对当前入侵检测中存在的问题给出了一种基于生物免疫机制和模糊逻辑的自适应入侵检测模型,分别对正常行为模式和待检测行为模式建立模糊关联规则集,通过比较待检测行为模式的规则集与正常行为模式的规则集的相似度,确定是否有入侵事件发生;此外,模型还可以自适应在线升级自身的抗体规则,从而提高了抵御新型攻击的能力和自适应性.经过仿真测试,证明该模型可以有效地检测异常攻击事件.
- 高君杰张东站肖欣延薛永生
- 关键词:入侵检测人工免疫模糊逻辑自适应
- 一种利用语义相似度改进问答摘要的方法被引量:4
- 2017年
- 在搜索引擎中对用户问题直接给出简要的答案(即答案摘要)可以帮助用户更快捷的获取信息。针对这一任务,设计一种基于特征的答案摘要抽取方法。为了进行句子相似性的计算,提出通过使用卷积神经网络表示句子语义和计算相似性,同时给出基于最大间隔学习的网络训练方法。在百度知道问答语料上的实验结果表明,所提出的答案摘要抽取方法能够生成质量良好的简短回答。与基于词袋的相似性计算相比,使用卷积神经网络能够更好地描述句子语义,计算问题和句子之间的相似性,有效地改善答案摘要的质量。
- 应文豪肖欣延李素建吕雅娟穗志方
- 关键词:语义相似度计算卷积神经网络
- 2009中国机器翻译研讨会计算所系统描述
- 本文介绍了中国科学院计算技术研究所自然语言处理实验室参加2009年中国机器翻译研讨会机器翻译评测的情况。今年,我们参加了汉英新闻领域单一系统及系统融合,英汉新闻、英汉科技和汉蒙日常用语五项评测任务,使用了Silenus、...
- 米海涛刘群刘洋冯洋夏天肖欣延熊皓郑达奇涂兆鹏吕雅娟
- 关键词:机器翻译自然语言处理
- 文献传递