江宝林
- 作品数:8 被引量:93H指数:5
- 供职机构:复旦大学信息科学与工程学院计算机与信息技术系更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 全文检索模型综述被引量:25
- 2004年
- 全文检索的应用导致了信息检索领域的一场革命,是文档数据库研究的核心。全文检索的首要问题是全文检索模型的选择。本文介绍了目前国内外主要的全文拴索模型,总结了全文检索模型的评价标准,按照此标准对各种模型进行了分析比较,并对全文检索模型构建中一些关键问题进行了分析。
- 申展江宝林陈祎唐磊胡运发
- 关键词:信息检索文档数据库倒排表互关联后继树位图
- 基于互关联后继树的Web日志挖掘技术被引量:3
- 2004年
- 本文将互关联后继树 (Inter RelatedSuffixTree ,IRST)模型应用于Web日志事务挖掘 ,构造Web日志事务集的互关联后继树结构 ,从中挖掘频繁路径。
- 江宝林张川申展葛家翔胡运发
- 关键词:INTERNETWEB日志挖掘互关联后继树网站
- 一个基于语义分析的倾向性文档过滤系统被引量:15
- 2005年
- 目前的过滤系统大都是基于关键词的 ,这类系统适用于主题性过滤 ,而对倾向性过滤效果不好。本文提出一种适用于倾向性文档过滤的系统 ,通过语义分析 ,有效地识别和过滤倾向性文本信息。
- 江宝林刘永丹金峰葛家翔胡运发
- 关键词:主题性文档过滤关键词语义分析文本信息
- 个性化推荐系统研究
- 随着以电子期刊和在线文档形式存在的科技文献的不断增加,对科研教学人员来讲,如何充分利用现有的网络信息资源,从庞杂的电子文档中及时、准确地获知与自己研究领域相关的最新科技信息就显得非常必要.对于科教人员这一特定群体来讲,其...
- 江宝林
- 关键词:推荐系统文本过滤用户模型WEB日志挖掘
- 文献传递
- 互关联后继树模型及其实现被引量:16
- 2005年
- 全文检索是文本数据库研究的核心 ,而全文检索的首要问题是全文检索模型的选择。本文介绍了一种新颖的全文检索模型———互关联后继树模型及其实现 ,并将该模型与传统的倒排表模型进行了比较 。
- 申展江宝林张谧唐磊胡运发
- 关键词:文本数据库互关联后继树模型信息检索
- TTFS:一个倾向性文本过滤系统的设计与实现被引量:16
- 2003年
- 以往文本过滤的研究主要集中于主题性过滤,然而随着网络的发展,倾向性文本过滤在网络信息安全方面的作用越来越大。论文阐述了一个倾向性文本过滤系统TTFS(TendencyTextFilteringSystem),能够对具有关于某个主题的特定倾向的文本进行过滤。该系统充分利用了领域知识,采用了语义模式分析等技术,实验表明其查全率和查准率高,速度较快。
- 金峰刘永丹江宝林胡运发
- 关键词:互关联后继树
- 结合网站内容和结构进行的Web日志挖掘被引量:23
- 2004年
- 提出一种以聚类为基础的Web日志挖掘方法:从Web日志事务、Web站点内容和Web站点结构3个不同方面来聚类页面集合,并通过将用户的访问记录和页面聚集进行匹配和相关度计算,来预测用户感兴趣的页面。
- 江宝林申展张川葛家翔胡运发
- 关键词:WEB日志挖掘聚类
- 基于互关联后继树的频繁模式挖掘研究被引量:3
- 2004年
- 关联规则挖掘是数据挖掘的一个重要的研究内容,而产生频繁模式集是关联规则挖掘的第1步工作。很多传统的频繁模式挖掘算法都需要产生候选模式集,因而效率很低。该文提出了一种不需要产生候选集,而直接构造频繁集的频繁模式挖掘算法——基于互关联后继树的频繁模式挖掘算法。实验证明,该算法具有较好的性能。
- 申展江宝林唐磊胡运发
- 关键词:关联规则频繁模式挖掘互关联后继树模型数据挖掘