孙晶涛
- 作品数:4 被引量:7H指数:2
- 供职机构:兰州理工大学计算机与通信学院更多>>
- 发文基金:“十一五”国家科技支撑计划甘肃省教育厅科研基金国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- LSA和MD5算法在垃圾邮件过滤系统的应用研究被引量:5
- 2007年
- 随着对垃圾邮件问题的普遍关注,针对目前邮件过滤方法中存在着的语义缺失现象和处理群发型垃圾邮件低效问题,提出一种基于潜在语义分析(LSA)和信息-摘要算法5(MD5)的垃圾邮件过滤模型。利用潜在语义分析标注垃圾邮件中潜在特征词,从而在过滤技术中引入语义分析;利用MD5在LSA分析基础上,对群发型垃圾邮件生成"邮件指纹",解决过滤技术在处理群发型垃圾邮件中低效的问题。结合该模型设计了一个垃圾邮件过滤系统。采用自选数据集对文中设计的系统进行测试评估,经与Nave Bayes算法过滤器进行比较,证明该方法在垃圾邮件过滤上优于Nave Bayes方法,实验结果达到了预期的效果,验证了该方法的可行性、优越性。
- 张秋余孙晶涛闫晓文黄文汉
- 关键词:特征提取潜在语义分析MD5算法垃圾邮件过滤
- 基于内容的垃圾邮件过滤技术研究
- 随着Internet的迅速普及,垃圾邮件问题引起了社会广泛的关注。目前解决垃圾邮件问题有众多的途径和思路,其中基于内容的垃圾邮件过滤是一个较为重要的方法。
本文从国内垃圾邮件泛滥的现状出发,以中文垃圾邮件过滤的相关...
- 孙晶涛
- 关键词:中文垃圾邮件过滤潜在语义分析模糊支持向量机
- 博弈论在邮件特征选择中的应用被引量:2
- 2011年
- 特征选择在垃圾邮件过滤中起着十分重要的作用,本文分析讨论了现有邮件特征选择方法所存在的不足,并在此基础上,提出一种基于博弈论的邮件特征选择模型。该模型将博弈论应用于邮件特征选择中,以达到约减信息规模,提高垃圾邮件过滤效率的目的。在设计特征选择模型时,考虑到邮件样本自身的模糊隶属性对特征选择所产生的影响,在特征点对邮件类别的区分度定义中,通过引入由相融性度量定义的样本模糊隶属度函数,提高博弈邮件特征选择模型对实际问题的处理能力。在CDSCE语料库上的实验表明,该邮件特征选择模型的性能优于同类其他特征选择方法,验证了该邮件特征选择模型的有效性。
- 孙晶涛张秋余袁占亭董建设
- 关键词:中文垃圾邮件博弈论隶属度函数
- 基于LSA和MD5算法的垃圾邮件过滤系统研究
- 随着Internet的迅速普及,垃圾邮件问题引起了社会广泛的关注。目前解决垃圾邮件问题有众多的途径和思路,其中基于内容的垃圾邮件过滤是一个较为重要的方法。
本文采用潜在语义分析方法/(LSA/),通过对邮件样本...
- 孙晶涛
- 关键词:特征提取潜在语义分析MD5算法垃圾邮件过滤
- 文献传递