您的位置: 专家智库 > >

孔贝贝

作品数:11 被引量:74H指数:4
供职机构:中国科学院文献情报中心更多>>
发文基金:国家社会科学基金更多>>
相关领域:文化科学自动化与计算机技术更多>>

文献类型

  • 9篇期刊文章
  • 2篇专利

领域

  • 7篇文化科学
  • 4篇自动化与计算...

主题

  • 3篇用户
  • 3篇大数据
  • 2篇聚类
  • 2篇画像
  • 1篇形码
  • 1篇学术
  • 1篇用户聚类
  • 1篇用户群
  • 1篇用户群体
  • 1篇知识
  • 1篇知识抽取
  • 1篇知识图
  • 1篇知识图谱
  • 1篇融合技术
  • 1篇身份认证
  • 1篇属性信息
  • 1篇数据管理
  • 1篇数据融合
  • 1篇数据融合技术
  • 1篇数字资源

机构

  • 10篇中国科学院文...
  • 4篇中国科学院大...
  • 1篇武汉大学
  • 1篇中国科学院

作者

  • 11篇孔贝贝
  • 5篇钱力
  • 5篇谢靖
  • 4篇吴振新
  • 3篇付鸿鹄
  • 2篇王玉菊
  • 2篇师洪波
  • 1篇郭红梅
  • 1篇王颖
  • 1篇张智雄
  • 1篇司莉
  • 1篇李文燕
  • 1篇陈瑶

传媒

  • 3篇数据分析与知...
  • 1篇图书情报工作
  • 1篇图书馆杂志
  • 1篇情报学报
  • 1篇现代图书情报...
  • 1篇新世纪图书馆
  • 1篇电脑知识与技...

年份

  • 1篇2024
  • 5篇2019
  • 2篇2017
  • 1篇2016
  • 1篇2015
  • 1篇2014
11 条 记 录,以下是 1-10
排序方式:
国际数字保存联盟建设:类型与特征分析
2024年
数字保存联盟是开展数字资源长期保存的重要方式,分析国际数字保存联盟的建设类型和特征,能够为我国数字保存联盟的构建与发展提供一定参考。本研究从联盟成立时间、运行状态、目标定位、资源存用方式、成员构成和资金来源等维度分别对43个国际数字保存联盟进行调查分析,国际数字保存联盟在萌芽期、平稳发展期和转型期3个阶段中成员呈现出多元化特征,资源导向在联盟目标定位中最为突出,开放保存是联盟采用最多的资源存用方式,资金来源渠道较广泛。
司莉李圆圆陈子俊孔贝贝
关键词:数字资源
一种学术画像模型的构建方法及装置
本发明公开了一种学术画像模型的构建方法及装置,所述方法包括:获得科研用户与参加的科研活动、产出科研成果相关的数据信息;根据所述数据信息,构建多级科研用户学术画像模型构架,进而建立多级科研用户学术画像模型的用户原始数据层;...
谢靖孔贝贝钱力师洪波
文献传递
ZXing条形码扫描技术在移动数字图书馆中的应用被引量:3
2016年
该文通过把条形码扫描技术同移动端网络交互技术进行融合,给出了条形码技术在数字图书馆中使用的通用技术方案。通过对条形码技术及ZXing使用技术进行分析及把ZXing条形码扫描技术用于中科院文献情报中心安卓移动端应用,给开发者们进行数字图书馆及其他移动应用建设提供了思路。通过对ZXing由理论分析到最终的技术使用,详细说明了ZXing在数字图书馆应用中的使用场景与使用方法,为条形码扫描技术在移动端数字图书馆中的应用提供了好的服务范例。Zxing条形码扫描识别技术在移动数字图书馆应用中将发挥更多的作用。
孔贝贝
关键词:条形码
DROID开源工具在长期保存系统格式识别中的应用被引量:1
2015年
【目的】在数字资源长期保存系统(DPS)中应用开源格式识别工具获取复杂对象的格式信息。【应用背景】在现有开源工具的基础上,为满足DPS的实际需求、保障效率和执行效果,需选择合适的工具进行二次开发和集成应用。【方法】分析比较现有两种常用工具,选取DROID作为DPS的格式识别工具,同时针对DPS效率要求,提出选用DROID批量格式识别的处理思路,并对其进行有效封装。【结果】将DROID封装为"DPS的批量格式处理模块"并在DPS格式识别及技术元数据抽取中得到实际应用。【结论】DROID是一个优秀的开源工具,其自动批处理特性基本满足DPS格式处理需求。
王玉菊吴振新孔贝贝付鸿鹄
一种唯一身份认定方法及装置
本发明公开了一种唯一身份认定方法及装置,所述方法包括:获得第一科研用户实体的属性信息,所述属性信息包括第一类型信息、第二类型信息和第三类型信息中的一种;依次判断所述第一科研用户实体的属性信息与所述第二科研用户实体的属性信...
孔贝贝谢靖常志军钱力
文献传递
第10届数字对象长期保存国际会议(iPRES2013)综述被引量:6
2014年
全面地回顾第10届数字对象长期保存国际会议(iPRES2103)的内容,并进一步揭示长期保存领域当前的发展现状和研究热点。重点介绍Web Archive相关研究与挑战、长期保存重点研究对象的转移及相关技术问题、合作与共享及涉及的互操作问题、长期保存的国家战略、评估与评价、保存监控管理、技术与基础设施以及可扩展的大规模保存等相关主题内容与研究热点问题。
吴振新付鸿鹄李文燕陈瑶孔贝贝
关键词:IPRES
科技大数据增值丰富化方法研究与工具研发被引量:5
2019年
【目的】解决科技大数据数据源分散、质量不高、内容单薄等问题。【方法】采用数据清洗、实体对齐、实体字段融合、冲突检测等增值计算方法,设计开发一套科技大数据增值丰富化的工具。【结果】通过本文研发的丰富化工具,在人员、机构、会议、期刊实体及实体关系层面实现实体数据对齐,实体字段内容增加5-10倍,实体分析维度提升2-3倍。【局限】增值数据的及时性、规范性需要结合服务需求在实际应用中不断优化提升。【结论】研究成果提升了科技大数据知识发现平台以及相关情报智能分析系统的数据服务维度及深度。
孔贝贝谢靖钱力钱力吴振新
科技大数据知识图谱构建模型与方法研究被引量:28
2019年
【目的】研究从科技大数据中提取结构化知识、构建学术知识网络的模型与方法,支持智能知识服务产品的研发提升精准知识发现能力。【方法】提出科技大数据知识图谱的构建模型和技术架构,在汇聚和融合科技大数据知识资源的基础上,以大数据平台分布式存储和高性能计算为支撑环境,详细设计和实现科研实体知识抽取、实体对齐和关系发现、知识融合与语义丰富化、语义化存储、质量管理等知识图谱构建技术。【结果】构建3亿实体和11亿关系的科技大数据知识图谱,有效支撑科技大数据知识发现平台和"慧科研"智能随身助手的服务。【局限】由于数据的规模和复杂性,知识图谱的质量管理仍需花费大量的人力,实体对齐的准确度也有待于提高。【结论】本文提出的知识图谱建设方案适用于科技大数据的知识管理和深加工,有助于科技知识的有效利用。
王颖钱力谢靖谢靖孔贝贝
关键词:知识图谱本体知识抽取
基于多重文本关系图中clique子团聚类的主题识别方法研究被引量:4
2017年
在网络成为最主要科学交流和信息传播渠道的今天,越来越多的机构将其研究成果以电子化形式呈现,这些电子化的文本资源中蕴涵着丰富的语义信息。面对这些海量的资源,科研人员很难在短时间内快速捕获文本中的主旨内容。如何高效准确地呈现文本资源中的核心主题,辅助科研人员对文本集中的重要关联信息进行聚焦,提高科研效率,一直是文本挖掘研究中的一个重要问题。在对现有有益研究成果借鉴的基础上,结合文本中术语和术语关系的特点,论文提出将文本中的术语和术语间的共现、句法和语义关系利用图结构进行表示,识别文本关系图中的紧密关联子团,基于所得到的紧密关联子团聚类来揭示文本子主题的整体研究思路。开展了两个方面的研究:①将文本集中的术语和术语间各种关系属性进行叠加归并,构建多重文本关系叠加模型;②基于clique子团间相似性距离和语义标识,进行聚类识别文本集中所包含的重要子主题。论文采用"migraine disorders"主题中近五年的文献构建文本集,对提出的方法开展了2个有效性实验。实验1与文本中领域专家所给出的标引词按语义类型分组结果对比,结果表明论文提出的方法与领域专家给出的标引词语义类型分组结果具有一致性;实验2与目前广泛使用的LDA方法结果进行对比,在准确率和召回率上都较LDA方法有所提高。2个实验均证明了文中方法的有效性。
郭红梅孔贝贝张智雄
科研学术大数据的精准服务架构设计被引量:25
2019年
【目的】研究面向科研学术大数据的精准服务架构,解决科研学者获取精准知识服务的问题。【方法】通过分析互联网应用精准服务现状,从数据组织、技术方法、应用场景三个方面,归纳对比精准服务的方法,面向科研学术生态链条设计精准服务体系。【结果】精准服务架构设计梳理关联了数据生产、技术研发、应用服务环节,支撑了科研学术的精准搜索与推荐服务应用。【局限】该架构未与传统方法对比,还需结合实际应用评测验证精准性提升效果。【结论】本文解决了精准服务技术方法的单一性问题,为应用系统研发提供系统的架构支撑。
谢靖钱力钱力孔贝贝师洪波
关键词:架构设计
共2页<12>
聚类工具0