北京市优秀人才培养资助(20042D0501604)
- 作品数:3 被引量:12H指数:2
- 相关作者:刘丽珍宋瀚涛陆玉昌张超林陈俊杰更多>>
- 相关机构:首都师范大学清华大学北京理工大学更多>>
- 发文基金:北京市优秀人才培养资助国家重点基础研究发展计划北京市教育委员会科技发展计划面上项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 支持向量机在网页信息分类中的应用研究被引量:8
- 2007年
- 针对日益膨胀的网络信息,为方便用户准确定位所需的信息,将支持向量机(SVM)与二叉决策树结合起来进行网页信息的分类,并在构造决策支持向量机分类模型的基础上,进一步结合聚类的方法,解决多类分类问题,减少支持向量机的训练样本数,提高分类训练速度和分类准确率.
- 刘丽珍贺海军陆玉昌宋瀚涛
- 关键词:支持向量机决策树网页分类
- 无标记训练样本的Web文本分类方法被引量:2
- 2006年
- 在文本分类中获得有类别标记训练样本的代价是很高昂的,本文针对这个问题对传统的模糊聚类方法进行改进,提出模糊划分聚类方法 FPCM,将聚类的无监督性和样本的先验知识结合起来,通过相似度度量聚类相关文本,取得比较客观的簇和少量标记文本,为监督学习找到分类依据,并结合朴素贝叶斯增量学习方式进行分类器的学习。本文进一步用估计分类误差损失的方法平衡选取候选样本,提高了分类准确率,实现了应用范围更加广泛的无标记文本分类学习模型。
- 刘丽珍宋瀚涛陆玉昌
- 关键词:WEB文本分类模糊聚类朴素贝叶斯
- Web使用挖掘中网站结构和内容的作用被引量:2
- 2006年
- 描述了Web使用挖掘与网站结构和内容的应用之间的相关性;强调了为完成Web使用挖掘而进行网站结构和内容的处理问题;进一步证实了将网站结构和内容与使用挖掘过程结合起来,可以极大地提高挖掘效率和质量,从而更好地发现Web上的用户模式,并对网站结构和内容设计起到辅助作用。
- 张超林刘丽珍陈俊杰
- 关键词:WEB使用挖掘页面文件