您的位置: 专家智库 > >

林明明

作品数:7 被引量:19H指数:2
供职机构:辽宁工程技术大学软件学院更多>>
发文基金:辽宁省高等学校杰出青年学者成长计划国家自然科学基金辽宁省高校创新团队支持计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 7篇中文期刊文章

领域

  • 7篇自动化与计算...

主题

  • 3篇语义
  • 3篇情感分类
  • 2篇语义相似
  • 2篇语义相似度
  • 2篇知网
  • 2篇特征加权
  • 2篇相似度
  • 2篇消费情感
  • 2篇加权
  • 2篇加权算法
  • 1篇映射
  • 1篇映射法
  • 1篇余度
  • 1篇语料
  • 1篇语料库
  • 1篇冗余
  • 1篇冗余度
  • 1篇情感
  • 1篇中文
  • 1篇坐标映射

机构

  • 7篇辽宁工程技术...

作者

  • 7篇林明明
  • 7篇邱云飞
  • 6篇邵良杉
  • 2篇刘世兴
  • 1篇赵彬
  • 1篇王伟

传媒

  • 3篇计算机应用
  • 2篇模式识别与人...
  • 1篇计算机工程与...
  • 1篇中文信息学报

年份

  • 2篇2016
  • 3篇2015
  • 1篇2014
  • 1篇2013
7 条 记 录,以下是 1-7
排序方式:
基于相关性及语义的n-grams特征加权算法被引量:2
2015年
n-grams作为文本分类特征时易造成分类准确率下降,并且在对n-grams加权时通常忽略单词间的冗余度和相关性.针对上述问题,文中提出基于相关性及语义的n-grams特征加权算法.在文本预处理时,对n-grams进行特征约简,降低内部冗余,再根据n-grams内单词与类别的相关性及n-grams与测试集的语义近似度加权.搜狗中文新闻语料库和网易文本分类语料库上的实验表明,文中算法能筛选高类别相关且低冗余的n-grams特征,在量化测试集时减少稀疏数据的产生.
邱云飞刘世兴林明明邵良杉
关键词:语义相似度N-GRAMS特征加权
基于HGSD的消费情感分类算法被引量:2
2015年
针对中文消费评价的情感分类问题,构造基于词典语义概念和上下文语义相结合的情感分类方法,对情感进行分类.该方法首先构造提取不同领域基准词集的方法.然后利用一元语言模型,通过How Net计算情感相似值,进行情感词提取.最后结合How Net方法和Google相似距离方法构造一种情感分类算法,对句子进行情感倾向性分类,既考虑词语本身含义,又考虑词语在上下文中的含义.通过对书籍、电脑和酒店的评价进行实验,F值较高,同时与其他方法进行对比实验,体现文中算法的有效性.
林明明邱云飞邵良杉
关键词:情感分类知网
基于分布和逆文本类别指数的特征迁移加权算法被引量:1
2015年
传统机器学习面临一个难题,即当训练数据与测试数据不再服从相同分布时,由训练集得到的分类器无法对测试集文本准确分类。针对该问题,根据迁移学习原理,在源领域和目标领域的交集特征中,依据改进的特征分布相似度进行特征加权;在非交集特征中,引入语义近似度和新提出的逆文本类别指数(TF-ICF),对特征在源领域内进行加权计算,充分利用大量已标记的源领域数据和少量已标记的目标领域数据获得所需特征,以便快速构建分类器。在文本数据集20Newsgroups和非文本数据集UCI中的实验结果表明,基于分布和逆文本类别指数的特征迁移加权算法能够在保证精度的前提下对特征快速迁移并加权。
邱云飞刘世兴林明明邵良杉
关键词:特征加权
基于三维坐标的模糊量化情感分类方法
2016年
针对微博情感分类问题,构造了基于三维坐标的模糊量化情感分类算法,通过将情感模糊量化,对微博进行多情感分类。首先对情感模糊处理,将情感分为六大类,根据六大类,定义并计算句子的模糊情感;其次将情感量化处理,根据情感类别构造三维坐标模型,将模糊情感值作为句子的坐标,通过坐标将句子映射到三维坐标模型中,使其量化;最后通过模糊量化处理后,根据与坐标轴的夹角判断句子最终的情感分类。通过实验,对三个作者的微博进行模糊量化处理,对其情感分类,实验结果的F值达到85%以上,同时与三种经典算法进行对比实验,准确率有了明显的提高。
林明明邱云飞邵良杉
关键词:情感分类
结合语义改进的K-means短文本聚类算法被引量:14
2016年
针对短文本聚类存在的三个主要挑战,特征关键词的稀疏性、高维空间处理的复杂性和簇的可理解性,提出了一种结合语义改进的K-means短文本聚类算法。该算法通过词语集合表示短文本,缓解了短文本特征关键词的稀疏性问题;通过挖掘短文本集的最大频繁词集获取初始聚类中心,有效克服了K-means聚类算法对初始聚类中心敏感的缺点,解决了簇的理解性问题;通过结合TF-IDF值的语义相似度计算文档之间的相似度,避免了高维空间的运算。实验结果表明,从语义角度出发实现的短文本聚类算法优于传统的短文本聚类算法。
邱云飞赵彬林明明王伟
关键词:K-MEANS算法知网语义相似度
基于二维坐标映射法的消费情感分类方法
2014年
针对中文消费评论的情感分类问题,构建了一种基于语料库的二维坐标映射法的情感分类方法。根据中文语言特点,首先提出了基于语料库的搜索方法,使搜索更有针对性;其次,定义了提取表达情感的中文短语的规则;第三,构造了某领域的最佳种子词选取算法;最后,构造了二维坐标映射算法,通过计算评论句子的坐标值,将其映射到二维直角坐标系中,判断句子的语义倾向性。选取亚马逊网站某商家1200条与牛奶相关的评论(好、差评各600条)进行实验,首先根据最佳种子词选取算法选取"很好-漏"作为最佳种子词,再根据二维坐标映射算法判断评论的情感极性,实验的平均F值达到了85%以上。实验结果表明该算法可以对消费评论进行情感分类。
林明明邱云飞邵良杉
关键词:中文情感分类语料库
基于三维坐标的消费情绪本体库建立及应用
2013年
针对商家好评中存在非真正满意的评价问题,构建一种能够真正反映消费者情绪状态的方法,以减少好评率中非真正满意的评价。针对消费情绪进行了研究,首先从评价中提取出消费情绪词汇,根据消费情绪的特征,将消费情绪划分为7大类,25小类,建立了三维坐标模型;其次,用Protégé来构建消费情绪本体库,根据三维坐标词汇分类算法对消费情绪词汇进行自动划分;然后,根据构建的本体库,用消费情绪判断算法来自动判断消费者的评价。最后,与淘宝的好评率进行比较,F值达到了95%以上,减少了好评中非真正满意的评价,体现了消费者的真实情绪。
邱云飞林明明邵良杉
关键词:消费情绪词汇分类本体库
共1页<1>
聚类工具0