蔡泽键
- 作品数:1 被引量:45H指数:1
- 供职机构:广东外语外贸大学思科信息学院更多>>
- 发文基金:教育部人文社会科学研究基金广东省科技计划工业攻关项目国家社会科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于朴素贝叶斯的微博情感分类被引量:45
- 2012年
- 本文基于二次情感特征提取算法,利用句法依存关系进行一次文本情感特征提取,在此基础上,利用情感词典,进行二次情感特征提取。构建朴素贝叶斯分类器,对采集的热门话题微博和酒店评论进行文本情感倾向性分类。主要比较了表情符号、标点符号,基于情感词典的特征提取和基于二次情感特征提取方法,在不同的组合下的分类性能,寻找更佳的微博文本情感分类预处理方法。并与酒店评论情感分类结果对比、分析,发现影响微博情感分类性能的原因。实验结果表明,二次特征提取方法在分类上取得更高的F1。实验最佳的分类预处理方式是"表情符号+标点符号+二次情感特征提取+BOOL值"。同时发现,朴素贝叶斯在酒店评论情感分类取得更高的分类性能,主要是微博评价对象多样化造成的。
- 林江豪阳爱民周咏梅陈锦蔡泽键
- 关键词:文本情感分类朴素贝叶斯