陈金菊 作品数:11 被引量:66 H指数:6 供职机构: 南京大学信息管理学院 更多>> 发文基金: 国家社会科学基金 广西教育厅科研项目 更多>> 相关领域: 文化科学 自动化与计算机技术 更多>>
图书馆电子阅读器内容推送模式的探讨 被引量:6 2016年 电子阅读器服务作为图书馆的一种特色服务,逐渐获得业内关注,已在一定程度上得到推广应用。但该项服务目前存在内容同质、学术内容匮乏、获取方式单一等问题,影响图书馆开展深层次的服务。本文设计适用于图书馆的电子阅读器内容推送模式,并以学术期刊资源推送为例,对该模式进行应用研究,探讨如何将定制的内容推送到电子阅读器终端,为图书馆深入开展电子阅读器服务提供参考。 胡昌文 唐振贵 陈金菊关键词:电子阅读器 图书馆 基于道路法规知识图谱的多轮自动问答研究 被引量:11 2020年 [目的/意义]传统的基于知识图谱的自动问答研究主要是针对用户提问直接检索答案,但由于系统对用户问题的理解存在歧义,导致得到的答案不够精确。采用基于知识图谱的多轮自动问答可以有效地改善这一问题。[方法/过程]本文首先构建了以事件为中心的道路法规本体模型,依据该模型从道路法规中抽取实例图谱,并设计出基于道路法规知识图谱的问答框架。然后,对该框架所使用到的模型进行测评。最后,进行系统的总体测评。[结果/结论]从模块测评结果来看,本文所提出BCNN_BiLSM模型在事件识别和意图识别的F1值分别是0.798和0.930,BBiLSTM_CRF模型在本体属性识别F1值为0.807,总体性能优于其他模型。系统的总体测评结果表明,完整句的准确率为0.74,缺省句的任务完成率为0.83。本文提出的基于道路法规知识图谱的多轮自动问答可为相关领域自动问答研究提供参考。 陈金菊 王义真 欧石燕关键词:知识图谱 本体 自然语言处理 典型通用事件语义模型比较分析研究 被引量:6 2021年 [目的/意义]事件语义模型是描述和组织事件内容的语义框架。对事件语义模型进行总结和剖析,可为相关研究提供参考。[方法/过程]文章梳理总结了7个典型通用事件语义模型(Event、SEM、LODE、ABC、LODE、EBSTDM和刘宗田等提出的事件语义模型),并从其特点和应用领域等方面进行详细比较分析。[结果/结论]展望了事件语义模型的发展趋势,包括开发新的语义表示维度和建模视角;事件语义模型的横向连续性和纵向层次化相结合的研究;事件语义模型动态特征的语义组织研究。 陈金菊 欧石燕 林泽斐关键词:动态性 EVENT SEM ABC 信息资源语义组织与语义服务模式探究——以芬兰语义计算研究小组(SeCo)项目实践为例 被引量:7 2019年 利用语义网技术对信息资源进行语义组织,提供语义检索、语义集成和语义共享等深层次语义服务,已成为知识组织和服务的趋势。国外已有许多研究和服务机构开展信息资源语义组织和语义服务实践,其中以芬兰语义计算研究小组(SeCo)项目实践最具代表性和前沿性。文章从资源类型与标注深度、语义模型、语义数据构建与集成、语义服务这四个方面,对SeCo实践进行分析,研究发现:语义组织的对象从书目向非书目信息资源扩展;语义标注的深度从外部特征向内容语义深入;信息资源的覆盖范围从单一领域向多领域扩展;语义服务从文本向图像可视化发展;语义服务从单一向多样化发展。 陈金菊 欧石燕 林泽斐关键词:语义服务 语义模型 可视化分析 突发事件新闻语义建模研究 被引量:5 2021年 【目的/意义】突发事件新闻具有连续性特征,现存的语义模型无法很好地表示这一特征,通过构建突发事件新闻语义模型可以实现对这些连续性信息的深层次语义描述和利用。【方法/过程】本文根据由表及里的建模思维,构建了一个突发事件新闻深层次语义描述本体模型。该模型分为元数据和内容语义两部分,内容语义部分以事件为起点、以连续性情景和动作为核心。在对突发事件新闻案例进行语义描述的基础上,实现了语义检索、语义推理、语义数据可视化分析等应用。【结果/结论】通过语义标注和应用实验,验证了该模型的可用性。【创新/局限】本文提出的突发事件新闻本体模型,较好地解决了突发事件新闻连续性信息的语义标注问题。 陈金菊关键词:突发事件 语义建模 语义检索 语义推理 可视化分析 基于数据挖掘的读者个性化服务研究 被引量:11 2016年 高校图书馆信息资源的快速增长,使得读者难以快速地获取有效的信息。如何化"被动服务"为"主动服务",为读者提供个性化服务已成为高校图书馆发展过程中遇到的问题之一。文章构建了一个基于数据挖掘的读者个性化服务模型,并采用Clementine12.0对读者借阅记录进行挖掘实验。最后,详述了聚类结果在高校图书馆个性化服务中可能的具体应用,包括读者个性化推荐服务、最大借阅天数和最大借阅册数的个性化调整以及制定个性化图书采购策略。 陈金菊关键词:数据挖掘 聚类 图像语义标注研究综述 被引量:7 2017年 图像语义标注是实现图像语义检索的重要环节和关键。文章概述了图像语义标注的三个发展阶段,并对目前图像语义标注的三个研究重点,即图像语义标注模型、图像语义标注工具、语义鸿沟问题以及解决该问题的方法,进行总结和分析。最后,就如何弥合语义鸿沟提出三点建议:融合多学科的研究成果来缩小语义鸿沟;人工标注与自动标注相结合;采用本体技术进行图像语义标注。 陈金菊关键词:图像语义标注 语义鸿沟 民事裁判文书两阶段式自动摘要研究 被引量:4 2021年 【目的】针对民事一审裁判文书内容进行文本自动摘要,为裁判文书的用户提供简练可读、连贯通顺和准确高效的摘要文本。【方法】提出一种面向裁判文书自动摘要的新方法,该方法由抽取式摘要和生成式摘要两个阶段构成。在第一阶段抽取式摘要中,在预训练模型的基础上加入膨胀残差门控卷积神经网络进行裁判文书关键句子抽取得到抽取式文摘;在第二阶段生成式摘要中,将抽取式文摘作为模型的输入,通过序列到序列模型生成最终的裁判文书摘要。【结果】本文所提模型在裁判文书自动摘要实验中的ROUGE指标分别是50.31、36.60、48.86,较基准模型LEAD-3分别提高25.00、23.25、24.66。【局限】将第一阶段得到的抽取式摘要作为第二阶段生成式模型的输入,存在模型的累计误差,模型的整体效果受到第一阶段抽取式模型的影响。【结论】本文模型可以有效地应用在裁判文书自动摘要服务中,解决裁判文书信息过载问题,为裁判文书用户提供了一种快速阅读裁判文书、获取知识的新途径。 王义真 欧石燕 陈金菊关键词:裁判文书 基于WOS的元数据知识图谱研究 2017年 [目的/意义]对元数据研究进行较为全面的梳理,把握其发展脉络。[方法/过程]采集Web of Science数据库中1982—2015年间的5712篇文献,使用Cite Space V作为分析工具,对元数据研究的学科领域、研究机构、作者分布、知识基础进行可视化分析。[结果/结论]揭示了元数据研究的主要研究主体和知识基础,发现元数据研究的重要文献可以分为5个类别。 陈金菊关键词:元数据 知识图谱 知识基础 数字图像语义标注模型比较与分析 被引量:11 2018年 [目的/意义]图像语义标注的基础是图像语义标注模型的构建,对当前主流图像语义标注模型进行梳理和总结,剖析其在图像语义标注中的优缺点,可为后续相关研究提供借鉴和参考。[方法/过程]采用文献调研法,总结出4类主要的图像语义标注模型,即Eakins模型、Jaimes&Chang模型、Kong模型、Panofsky模型。其后采用比较法和归纳法,从语义层次、可扩展性以及应用范围和方式3个方面对前三类模型进行比较分析。[结果/结论]Eakins模型语义层次最全面,语义表达能力最强,应用范围最广;Kong模型的可扩展性最强,适应性最好。 陈金菊 欧石燕关键词:图像标注