广东省哲学社会科学规划项目(GD11CTS02)
- 作品数:3 被引量:14H指数:3
- 相关作者:李志义沈之锐肖炯恩更多>>
- 相关机构:华南师范大学广州中国科学院软件应用技术研究所更多>>
- 发文基金:广东省哲学社会科学规划项目国家社会科学基金更多>>
- 相关领域:自动化与计算机技术文化科学经济管理更多>>
- 基于网络隐社区反链接挖掘的企业战略情报分析被引量:6
- 2012年
- 网络中的网址相互链接和反链接形成了"网络社区",对其结构的挖掘和分析能观察到社区成员间的关系和意图。选择空软作为反链接的查询工具,通过对某知名软件公司的反链接主题分析划分出该公司的"隐社区",然后根据隐社区的相关度和反链接的贡献值计算出战略代表值,再通过对该值最高的网址进行竞争情报挖掘,分析出其战略意图,最后提出相关的战略决策建议。
- 李志义肖炯恩
- 贝叶斯分类算法在社交网站信息过滤中的应用分析被引量:5
- 2014年
- 对文档进行分类并鉴别出垃圾信息是一个非常有实用价值的研究领域,越来越多的网站开始关注这种技术。采用智能算法对垃圾信息进行有效分析,寻找垃圾制作者,并通过网络日志和所发表的内容,判断哪些是广告用户和垃圾信息的发布者,并将其删除。认为对垃圾信息的甄别其实是一种把信息分成有用信息和无用信息的过程,试用贝叶斯分类算法把信息分成不同的类。针对基于规则的分类方法和通过分析广告链接网址来剔除垃圾信息的方法的缺陷,给出贝叶斯分类算法及机器训练方法,从实验结果看,本方法优于基于规则的分类法。
- 李志义沈之锐义梅练
- 关键词:贝叶斯分类社交网站信息过滤
- 基于自然标注的网页信息抽取研究被引量:3
- 2013年
- 随着Web网页数量的爆炸式增长和网页噪声不断增多,网上获取重要信息变得越来越困难。本文从一个新的角度,提出了一种基于自然标注的网页信息抽取方法。依据这种方法,首先对网页进行聚类,提取具有相似结构的网页并进行相同的标注,然后采用SVM对抽取项进行训练,最后提取到需要抽取的数据。文章的主要贡献在于对网页中的自然标注进行分析和发现,给出了九大类自然标注的例子,并结合聚类和支持向量机,给出了训练方法。从实验结果上看,本方法优于其他方法。
- 李志义沈之锐
- 关键词:信息抽取聚类支持向量机语义