吕俊
- 作品数:3 被引量:7H指数:2
- 供职机构:北京化工大学信息科学与技术学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 化工专业搜索引擎系统架构设计与实现
- 本文研究并实现了化工专业搜索引擎系统。为了实现该专业搜索引擎系统,该文引入了综合型搜索引擎系统的架构模型,即网络蜘蛛、索引器和检索器,并且在该模型中增加了文件处理模块,专门用于转换网页文件为纯文本文件。该搜索引擎系统基于...
- 吕俊
- 关键词:搜索引擎系统检索器程序逻辑
- 文献传递
- 具有扩充检索功能的石油化工专业信息搜索引擎的设计与开发被引量:5
- 2005年
- 网络信息的日益增加迫切需要适宜的检索工具,特别是进行专业信息的检索,需要体现专业词汇特点的搜索引擎。本文在对搜索引擎核心技术进行研究的基础上,提出了石油化工信息搜索引擎的设计方案,开发了网络机器人模块,实现了海量网页的自动获取;采用最短路径分词和正向最大匹配相结合的算法,实现了中文自动分词;开发了信息索引模块,实现了网页的批量索引和增量索引;开发了信息检索模块,提供布尔逻辑查询,实现摘要自动生成。通过系统集成,初步建立了体现石油化工专业特点的搜索引擎。
- 山岚吕俊江毅铭欧歌王坚李世明
- 关键词:搜索引擎网络机器人自动分词信息索引信息检索
- JavaCC及其在搜索引擎技术中的应用研究被引量:2
- 2006年
- 搜索引擎中的HTML文档处理器和查询分析器都需要对特定格式的文本做词法分析和语法分析,以便构建出相应的数据结构。如果手工来编写这些分析程序,不仅编写代码工作量大,而且增加了测试的负担。本文研究了JavaCC的使用步骤和特点,并使用JavaCC构建了一个HTML文档处理器和一个查询分析器。实践表明,使用JavaCC能够大大缩短开发文本分析程序周期。
- 吕俊赵恒永
- 关键词:JAVACC词法分析语法分析UNICODEJAVA