余智学 作品数:4 被引量:2 H指数:1 供职机构: 合肥工业大学管理学院电子政务研究所 更多>> 发文基金: 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 理学 更多>>
基于兴趣文档集合游历便利性的站点结构优化模型 2008年 基于特定信息需求的网站用户游历其兴趣文档集合的便利性,建立了一种站点结构优化的数学模型,通过页组支持度与页组拓扑平均距离量化评估与挖掘站点中访问效率较低的内容文档集合为结构优化的兴趣页组,据此提出能综合评价站点访问效率的指标——WEB拓扑兴趣度,并通过分析新增超链接的影响因素设计了相应的站点结构优化方法,优化算法中采用遗传算法寻找最优组合的新增超链接组。实验结果表明:优化后的站点结构能有效改善信息搜索与获取行为的效率低下问题。 林文龙 刘业政 余智学 姜元春关键词:WEB使用挖掘 页面聚类 自适应站点 遗传算法 基于Web会话仿真的网站结构优化研究 Internet的迅猛发展和普及,使得Web信息量以惊人的速度增加,人们迫切需要能自动从Web上发现、抽取和过滤信息的工具。因此,产生了Web挖掘。Web使用挖掘是Web挖掘的重要分支,它利用数据挖掘技术对网站大量的用户... 余智学关键词:WEB使用挖掘 网站结构优化 关联规则 文献传递 基于Markov与PageRank算法的Web日志仿真器 被引量:1 2008年 获取可靠的Web访问会话数据是Web使用挖掘(WUM)的重要前提,而很多时候这种数据不容易得到。据此,采用数学建模的方法,设计并实现了一个Web日志仿真器(SSPM,Session Simulator based on PageRank and Markov)。SSPM用Markov链过程模拟用户访问过程,将用户Web访问过程抽象为Markov链,以PageRank算法计算页面重要度,并以此计算Markov初始状态和转移矩阵,获取用户仿真日志。还介绍了SSPM的验证方法。 余智学 林文龙关键词:WEB使用挖掘 马尔可夫链 PAGERANK算法 用页组拓扑平均距离改善页面聚类算法 被引量:1 2008年 提出一种支持站点结构优化的页面聚类改进算法,通过引入图论中的拓扑平均距离,量化评估与挖掘站点结构中访问效率较低的内容文档集合为结构优化的兴趣页组,挖掘的页组具有更高的兴趣性,并将兴趣页组挖掘算法融入到拓扑优化算法中。实验结果表明改进算法能更好地优化站点结构,较一般算法收敛性好。 林文龙 刘业政 余智学关键词:WEB使用挖掘 页面聚类 自适应站点