肖文艳
- 作品数:3 被引量:9H指数:1
- 供职机构:江西师范大学计算机信息工程学院更多>>
- 发文基金:国家自然科学基金江西省自然科学基金江西省教育厅科学技术研究项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 机器翻译自动评价中领域知识复述抽取研究
- 针对通用领域语料中抽取的复述在特定领域机器译文自动评价任务中应用容易导致复述匹配偏差的问题,提出采用抽取与测试领域相关的复述,来提高机器译文自动评价的方法。首先将通用单语训练语料进行聚类,并利用改进的M-L方法过滤,得到...
- 张丽林李茂西肖文艳万剑怡王明文
- 关键词:复述语言模型MARKOV网络文档聚类
- 汉语委婉语语言资源建设被引量:1
- 2020年
- 委婉语是语言交流中不可或缺的交际手段,委婉语研究一直是语言学界的热门话题之一,但在自然语言处理领域,尚未有委婉语相关研究。该文借助现有纸质词典,基于语料库检索和专家人工判别的方式,初步构建了规模为63000余条语料的汉语委婉语语言资源;并根据自然语言处理的相关任务需求,结合词典释义对委婉语进行分类。该文提出了利用同类委婉语的上下文语境辅助进行标注的方法。经过实验,对简单语义委婉语的语义判别准确率达89.71%,对语义复杂的兼类委婉语的语义判别准确率达74.65%,初步验证了利用计算机辅助人工标注构建委婉语语言资源的可行性。
- 张辰麟王明文谭亦鸣肖文艳
- 关键词:委婉语语义辨析
- 机器翻译自动评价中领域知识复述抽取研究被引量:8
- 2017年
- 针对通用领域语料中抽取的复述在特定领域机器译文自动评价任务的应用中容易出现复述匹配偏差的问题,提出采用抽取与测试领域相关的复述来提高机器译文自动评价的方法。首先将通用单语训练语料进行聚类,并利用改进的M-L方法过滤,得到特定领域训练语料,然后在训练语料中利用Markov网络模型,抽取特定领域复述表,最后将此复述表应用在机器译文自动评价中,以提高同义词和近义词的匹配精度。在WMT’14 Metrics task和WMT’15 Metrics task数据集上的实验结果表明,利用领域知识抽取的复述能够增加自动评价方法METEOR和TER与人工评价的相关性。
- 张丽林李茂西肖文艳万剑怡王明文
- 关键词:复述语言模型MARKOV网络文档聚类