谭松波
- 作品数:29 被引量:253H指数:8
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术理学文化科学更多>>
- 一种跨领域的文本情感分类器的训练方法和分类方法
- 本发明提供一种跨领域的文本情感分类器的训练方法,包括下列步骤:1)在源领域和新领域样本的关键词中挑选通用情感特征;2)根据源领域的样本,计算特征w<Sub>t</Sub>属于类别c<Sub>k</Sub>的样本的概率P(...
- 谭松波程学旗
- 文本情感倾向性分析方法
- 本发明提供一种文本情感倾向性分析方法,包括下列步骤:1)根据训练文本的标签确定测试文本的初始情感分;2)基于图排序算法利用所述测试文本的初始情感分迭代计算所述测试文本的情感分并进行归一化;3)当所述迭代结束时,根据所述计...
- 吴琼谭松波程学旗
- 文献传递
- 一种基于关键词的文本情感分类器的训练方法和分类方法
- 本发明提供一种基于关键词的文本情感分类器训练方法和分类方法,其中情感分类器训练方法包括下列步骤:1)在旧领域训练集和新领域测试集的文本的关键词中挑选枢纽特征;2)计算描述所述枢纽特征与所述旧领域训练集和新领域测试集的文本...
- 谭松波程学旗
- 文献传递
- 高性能文本分类算法研究
- 因特网上的文本信息的爆炸式增长给文本分类的精度与速度提出了新的标准与挑战。这就要求文本分类在提高精度的同时,还要进一步提升训练与分类速度。为了面对时代的挑战,作者从特征选择与学习算法两个角度展开了深入的研究,取得了一系列...
- 谭松波
- 关键词:特征提取文本分类文本挖掘信息检索
- 文献传递
- 大规模网络内容安全控制关键技术与示范系统研究
- 程学旗王丽宏余翔湛丁国栋熊刚舒敏黄文廷贺龙涛刘峰刘振业王勇王东滨李东何慧董永苹谭松波
- 大规模网络内容安全监控示范应用系统包括安全响应管控平台、信息对抗平台、互联网舆情监测系统等三个应用系统。安全响应管控平台能够在网络舆情暴发时,及时将控管指令在全网生效,并结合空路由技术和路由扩散技术将舆情控制在局部的最小...
- 关键词:
- 基于关键句的多语言情感数据处理分类方法及系统
- 本发明公开了一种基于关键句的多语言情感数据处理分类方法及系统,方法包括:步骤1,从未标注的情感数据集中自动抽取一部情感词典数据包,通过K近邻算法和投票规则来最终判定情感词的极性;步骤2,用抽取出的情感词典数据包计算情感属...
- 程学旗林政张瑾谭松波徐学可
- 文献传递
- 基于中文微博语料的情感倾向性分析被引量:11
- 2014年
- 微博的兴起与传播使得短文本情感分类成为目前的热门研究领域。通过对中文微博语料的情感倾向性分析进行研究,提出了一种新的情感分类方法。首先构建了两级情感词典,并对不同级别情感词作不同增强;然后在情感特征方面使用N-Gram方法,尽量获取有限长度博文中的未登录情感词和情感信息。经实验验证与传统方式相比较,该方法的准确率和召回率都有所提高,在COAE2014微博情感倾向性评测任务中也取得了较好的成绩。
- 罗毅李利谭松波程学旗
- 关键词:情感分类
- 基于情感关键句抽取的情感分类研究被引量:27
- 2012年
- 情感分析需要解决的一个重要问题是判断一篇文档的极性是正面的还是负面的.情感分类的正确率很难达到普通文本分类的水平,因为情感分类更难更复杂.在判断文档的情感极性时,不同的句子具有不同的情感贡献度,所以,对整篇文档的关键句和细节句进行区分将有助于提高情感分类的性能.关键句通常简短且具有判别性,而细节描述句通常复杂多样且容易引入歧义.在关键句抽取算法中,考虑3类属性:情感属性、位置属性和关键词属性.为了更好地利用关键句和细节句之间的差异性和互补性,将抽取的关键句分别用于有监督的和半监督的情感分类.在有监督情感分类中,采用的是分类器融合的方法;在半监督情感分类中,采用的是Co-training算法.在8个领域上进行实验,结果表明所提方法性能明显优于Baseline,从而证明情感关键句抽取算法是有效的.
- 林政谭松波程学旗
- 关键词:情感分类关键句分类器融合有监督学习半监督学习
- 一种跨领域文本情感倾向性分析方法
- 本发明提供一种跨领域文本情感倾向性分析方法,包括下列步骤:1)确定源领域和目标领域中文本与词的初始情感分;2)根据测试文本集和测试词集分别与所有词集和所有文本集的关系建立测试文本集D<Sup>U</Sup>与测试词集W<...
- 吴琼谭松波段洣毅程学旗
- 文献传递
- 基于随机游走模型的跨领域倾向性分析研究被引量:11
- 2010年
- 近年来,研究者们已经在跨领域倾向性分析方面取得了一些进展.然而,现有的方法和系统往往只根据已标注文本或者已标注情感词对目标领域文本进行倾向性分析,却缺乏一个统一的模型框架将文本与情感词之间全部知识进行有机的融合.提出了一种基于随机游走模型的跨领域倾向性分析方法,该模型能够同时利用源领域和目标领域文本与词之间的所有关系来对文本与词进行互相增强,旨在将文本之间的关系、词之间的关系、文本与词之间的相互关系集成到一个完整的理论框架中.实验结果表明,提出的算法能大幅度提高跨领域倾向性分析的精度.
- 吴琼谭松波许洪波段洣毅程学旗
- 关键词:中文信息处理随机游走图模型