朱少楠 作品数:12 被引量:81 H指数:5 供职机构: 南京师范大学 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 江苏省普通高校研究生科研创新计划项目 更多>> 相关领域: 天文地球 自动化与计算机技术 环境科学与工程 更多>>
地理空间关系描述的句法模式识别 地理空间关系是地理信息科学的重要问题之一。自然语言中包含着大量的空间关系,是空间关系研究的一种重要途径。句法模式是自然语言中地理空间关系描述的重要语言特征,在自然语言中空间关系信息抽取、GIS自然语言空间关系查询和理解、... 朱少楠 张雪英 张春菊关键词:句法模式识别 中文文本的地理命名实体标注 被引量:27 2012年 地理信息的语义解析有效地解决自然语言与地理信息系统之间的语义障碍问题。在分析中文文本和地理信息系统中地理实体描述和表达机制差异的基础上,结合地理命名实体描述的语言特点,制定中文文本的地理命名实体标注体系和标注规范,并以GATE(General Architecture for Text Engineering)作为标注平台,构建基于《中国大百科全书中国地理》的大规模标注语料库,以解决当前相关标准和规模化标准数据匮乏的问题。 张雪英 朱少楠 张春菊关键词:中文文本 标注语料库 自然语言 基于XML Schema的多源地名词典集成方法 被引量:5 2012年 目前,我国已经构建大量不同级别、面向不同应用的地名词典,网络大众化地名服务成为地名词典的必然发展趋势。该文提出一种基于XML Schema的多源异构地名词典集成方法,以XML Schema对地名词典进行数据描述,采用XSLT数据转换方法,运用MapForce软件,快速进行地名词典的数据结构映射,能够有效解决地名词典的跨平台及数据类型不统一问题。 张雪英 朱少楠 张春菊 徐希涛 杜超利关键词:XMLSCHEMA 数据集成 XSLT 中文文本的地理空间关系标注 被引量:22 2012年 为有效地解决当前相关标准和标准数据匮乏的问题,通过分析中文文本中地理空间关系描述的语言特点,提出中文文本的地理空间关系标注体系,并以GATE(General Architecture for Text Engineering)为标注工具,以《中国大百科全书中国地理》为文本数据源,采用交叉校验方式建立了地理空间关系标注语料库。实现了中文文本中地理空间关系描述的结构化表达,提供了地理空间关系信息抽取的标准化测试数据。 张雪英 张春菊 朱少楠关键词:自然语言 中文文本 标注语料库 基于网络爬虫的地名数据库维护方法 本发明公开了一种基于网络爬虫的地名数据库维护方法,主要包括两个部分:基于网络爬虫的空间敏感网页获取和网页文本中地名信息解析。具体步骤分为:基于Google搜索引擎服务的空间敏感网页获取;基于空间主题相关度的空间敏感网页过... 张雪英 张春菊 杜超利 朱少楠文献传递 基于网络爬虫的地名数据库维护方法 本发明公开了一种基于网络爬虫的地名数据库维护方法,主要包括两个部分:基于网络爬虫的空间敏感网页获取和网页文本中地名信息解析。具体步骤分为:基于Google搜索引擎服务的空间敏感网页获取;基于空间主题相关度的空间敏感网页过... 张雪英 张春菊 杜超利 朱少楠地理空间关系描述的句法模式识别 地理空间关系是地理信息科学的重要问题之一。自然语言中包含着大量的空间关系,是空间关系研究的一种重要途径。句法模式是自然语言中地理空间关系描述的重要语言特征,在自然语言中空间关系信息抽取、GIS自然语言空间关系查询和理解、... 朱少楠 张雪英 张春菊关键词:句法模式识别 基于层次空间参考模型的城市地址编码方法 本发明公开了一种基于层次空间参考模型的城市地址编码方法。该方法具体分为四个步骤:形成地理要素类型码、利用不同计算规则形成方位码、找出目标物到城市中心的最短距离作为距离码、随机生成要编码地理要素的随机码。本发明的方法能够综... 张雪英 吉雷静 朱少楠 张春菊文献传递 面向地理场景的“文--图--景”转换方法研究 自然语言和虚拟地理场景是两种重要的地理场景表达手段,在数据的丰富性、表达的直观性、认知的习惯性、应用的普及性等方面各有所长。如何将具有丰富语义的自然语言信息转换到虚拟地理场景中,已成为地理信息学科的热点研究问题。本文依托... 朱少楠关键词:自然语言 基于网络爬虫的地名数据库维护方法 被引量:24 2011年 目前,我国地名数据库建设存在大、中颗粒度地名集中,小颗粒度地名较为缺乏,地名资料陈旧、时效性较低,简称、别名等非标准地名信息和地名的相对位置信息缺失等问题。而地名数据库的更新维护工作主要通过人工测绘手段完成,存在周期长、成本高、效率低等缺点。针对这一问题,本文以现有地名数据库和空间关系词汇为基础,基于Google搜索引擎服务,提出一种以网页资源为数据源,利用网络爬虫技术和地名识别技术,进行地名数据库更新维护的方法。首先,设计以地名为主题的网络爬虫,实现非结构化的网页数据中海量空间敏感网页文本的主动获取;然后,采用HTML DOM技术解析空间敏感网页并应用CRF地名识别模型自动识别网页文本中地名;最后,设计相关算法进行网页文本中地名信息的自动解析,实现新地名和地名空间位置信息的获取,进行地名数据库的更新维护。以"南京师范大学仙林宾馆+西北"为空间检索实例,验证了此方法的可行性。 张春菊 张雪英 朱少楠 徐希涛关键词:地名数据库 网络爬虫 地名识别 主题相关性