赵栓柱
- 作品数:5 被引量:19H指数:2
- 供职机构:太原理工大学信息工程学院更多>>
- 发文基金:山西省自然科学基金教育部科学技术研究重点项目更多>>
- 相关领域:自动化与计算机技术理学文化科学更多>>
- 基于特定领域的Wed文本信息获取系统的研究与设计
- 随着Internet应用的普及,Web已成为人们获取信息的一个主要来源,搜索引擎虽说是人们检索Web信息的有力工具,但缺乏深入了解用户需求的方法和策略,加上Web所具有的开放性、动态性和异构性,使得用户(特别是特定领域的...
- 赵栓柱
- 关键词:搜索引擎中文分词技术
- 文献传递
- 基于用户访问兴趣的路径聚类研究被引量:14
- 2005年
- 网站可以通过关注用户访问路径、访问某个页面的时间、在此页面的驻留时间以及由那个链接到此页面的URL等信息,利用聚类技术将具有相同兴趣的用户分类。文章将介绍一种新的基于用户访问兴趣的路径聚类算法,其中定义了新的兴趣度、相似度、及聚类中心。最后采用龙城热线网站日志进行真实测试,实验的结果是成功的。
- 吴俊杰陈俊杰赵栓柱
- 关键词:聚类路径聚类数据挖掘
- 基于特定领域的Web文本信息获取系统的研究与设计
- 随着Internet应用的普及,Web已成为人们获取信息的一个主要来源,搜索引擎虽说是人们检索Web信息的有力工具,但缺乏深入了解用户需求的方法和策略,加上Web所具有的开放性、动态性和异构性,使得用户(特别是特定领域的...
- 赵栓柱
- 关键词:搜索引擎中文分词技术
- 文献传递
- 基于特定领域的Web文本信息获取系统的研究被引量:3
- 2006年
- 从特定领域用户获取Web文本信息的实际应用角度出发,在分析了系统相关开发理论基础上,通过从内容和语义上指导Web信息的搜索,尝试设计了一个基于特定领域的Web文本信息获取系统模型,并从实现技术上提出了开发这个系统的体系结构,分析了各组成模块的主要特点及其功能。着重研究了该系统的几项关键技术:Robot技术、Web页面内容的分析和站点结构的分析技术、中文文本的分类问题,包括中文的分词、特征提取、特征匹配及权值计算等的综合应用技术。
- 赵栓柱陈俊杰
- 关键词:中文分词
- 信息过滤中用户兴趣模型的表示被引量:2
- 2005年
- 用户兴趣模型的表示是信息过滤中的关键技术,它直接关系到过滤效果的好坏。比较了三种不同的用户兴趣模型:传统的关键字表示法、固定文章集法F D S (文章表示法)和基于示例法(段落表示法) ,并对它们进行了实验分析,得出后两种方法要优于第一种的结论。其技术的关键在于如何描述和更新用户的兴趣模型。
- 张美香陈俊杰赵栓柱
- 关键词:信息过滤用户兴趣模型关键字匹配