北京市重点实验室开放基金(ICDD201106)
- 作品数:2 被引量:5H指数:2
- 相关作者:徐雅斌李艳平董源李卓更多>>
- 相关机构:北京信息科技大学更多>>
- 发文基金:北京市重点实验室开放基金北京市教委科技计划面上项目国家自然科学基金更多>>
- 相关领域:自然科学总论自动化与计算机技术更多>>
- 基于社会计算和机器学习的垃圾邮件识别方法的研究被引量:2
- 2013年
- 在对目前各种垃圾邮件识别方法进行研究分析的基础上,结合社会计算的理论和机器学习的方法,提出了一种新的垃圾邮件识别方法。通过利用邮件头部中能反映联系人社会关系的特征来构造一张联系人来往关系图对垃圾邮件进行初次识别,对于无法确定存在社会关系的联系人的邮件再利用机器学习的方法进行识别。实验结果表明,采用该方法进行垃圾邮件识别较之单纯采用贝叶斯方法,识别准确率有了较大的提高,同时,识别时间得到降低。
- 董源徐雅斌李卓李艳平
- 关键词:社会计算垃圾邮件识别社会关系
- 基于MapReduce架构的网络热点话题发现被引量:3
- 2012年
- 提出了一种基于开源云计算平台Hadoop的网络热点话题发现方案.该方案采用MapReduce分布式并行计算架构处理海量、复杂数据,通过将命名实体词作为文本的特征项,并采用标题和正文的双向量表示文本.实验结果表明:随着参与并行计算节点数的增加,话题聚类所有的时间显著下降,因而网络热点话题发现的速度得到明显提高.
- 徐雅斌李艳平郑芬
- 关键词:网络舆情分析分布式并行计算文本聚类