张海超
- 作品数:10 被引量:62H指数:6
- 供职机构:中国科学技术信息研究所更多>>
- 发文基金:北京市自然科学基金国家科技支撑计划中国科学技术信息研究所预研基金项目更多>>
- 相关领域:文化科学自动化与计算机技术电气工程更多>>
- 利用Knowledge Graph的专利表示方法及其应用被引量:3
- 2017年
- [目的 /意义]在专利分析中引入Knowledge Graph,将专利内容转换为由Knowledge Graph中实体语义关系所构成的图结构,进而探索该形式的专利表示方法在识别专利诉讼案中专利证据的可行性。[方法 /过程]在专利内容转换过程中,首先采用自动术语识别方法提取其实体指称,并通过实体链接将实体指称转化为命名实体,进而根据图算法识别出该专利的隐含实体,最终形成该专利所对应的图结构。[结果 /结论]将该专利表示方式应用于硬盘驱动器领域来寻找专利诉讼案中可用的证据专利,实证结果表明,与当前主流的专利文本表示方式相比,该方法在寻找证据专利效果上有较大提升。
- 陈亮张海超杨冠灿雷孝平于庆国
- 从Nature期刊论文多维评价对比中美研究实力被引量:1
- 2016年
- 本文提出一种基于期刊论文的国家研究实力多维评价方法,从产出与影响力维度、国际和地区合作维度、研究机构维度、作者维度以及研究领域维度等来评价国家研究实力。最后以Nature期刊为例,对比分析中国大陆和美国的研究实力,揭示中美学术研究现状,找出我国的不足并提出应对策略,为我国科研创新提出建议。
- 张海超
- 利用Doc2Vec判断中文专利相似性被引量:10
- 2018年
- 目前专利侵权纠纷案件时有发生,企业一旦卷入专利侵权纠纷,通常会面临时间考验和经济损失。本文选取中文专利数据样本,抽取专利权利要求书形成训练语料,并利用Doc2Vec深度神经网络算法,计算权利要求书文本之间的相似度,得出与涉案专利相似性较高的专利。并且将上述方法应用到专利复审案件实验中,进行实证研究,取得了较好的效果。需要进一步提高训练数据的质量,对比其他算法的效果。利用该方法能够帮助专利审查人员和企业找到相似专利。
- 张海超赵良伟
- 关键词:专利侵权
- 基于SAO结构的中文相似专利识别算法及其应用被引量:10
- 2016年
- 本文根据中文专利权利要求书的特点,提出了基于SAO结构的中文相似专利识别算法。首先对权利要求书进行依存句法分析和语义角色标注,从中抽取出SAO(主-谓-宾)结构。其次计算SAO结构之间的相似度,由SAO结构的相似度得出权利要求书相似度,并对结果进行多维尺度分析(MDS)和聚类分析,判断专利间相似性。最后将该方法运用到专利无效中,取得了良好的效果。此外,本文需要进一步提高SAO结构抽取的准确性,也需要提高该方法在实际应用中的有效性。
- 张杰孙宁宁张海超翟东升冯秀珍
- 关键词:中文专利专利无效
- 基于专利的燃料电池及关键技术发展态势研究被引量:6
- 2016年
- 本文从专利数据角度聚焦电动汽车行业,对燃料电池领域的总体发展态势、主要研发机构、技术生命周期、关键分支技术和技术功效等方面进行分析。燃料电池专利技术发展已进八成熟期,日本占据领先地位。我国专利申请量逐年上升,企业应做好专利布局。燃料储备技术短时间内没有较好的技术突破口,我国企业和科研机构可以加大对燃料储备的检测技术和安全性研究。
- 张海超张静陈亮雷孝平
- 关键词:燃料电池电动汽车
- 我国生物医药专利许可主体状况分析——基于文献计量及社会网络分析的视角被引量:3
- 2018年
- 专利许可是技术转移和科技成果转化的一种重要形式。本文基于我国生物医药领域的专利许可数据,采用文献计量和社会网络分析方法,对专利许可主体的状况进行分析。研究表明,从总体状况看,我国生物医药专利许可的主要让与人不仅是学研机构,企业和个人也发挥重要作用,主要受让人是企业。从专利许可网络不同时间段的对比分析发现,我国生物医药专利许可网络一直都很松散,不存在明显的集中性,许可主体频繁更换,专利许可仍处于初期发展阶段。从网络中许可主体的类型看,个人在技术转移中作为技术供应方发挥的作用在逐渐减少,而企业的作用在不断增强。国内企业已经从早期的主要技术需求方逐渐转变成重要的技术供应和应用的主体,但在当前阶段,学研机构在技术转移中仍然占据重要地位。
- 雷孝平望俊成张海超
- 关键词:生物医药社会网络分析技术转移
- 基于论文和专利的区块链技术研发状况分析被引量:12
- 2017年
- 作为比特币的底层技术,区块链近年来已经脱离比特币发展成为一种新型的分布式、去中心化、去信任化的技术方案。本文检索了区块链技术的相关论文及专利数据,采用文献计量学方法,对国内外区块链技术的基础研究及技术创新状况从发展趋势、主要研发人员及机构、技术热点等多个角度进行了分析研究,希望能对我国区块链技术的发展及产业布局提供参考。
- 雷孝平张海超桂婕张静
- 关键词:区块链文献计量学
- 层次主题模型在技术演化分析上的应用研究被引量:15
- 2017年
- [目的 /意义]采用h LDA从专利语料库中抽取层次主题,以描述隐藏在专利文本中的技术结构,并基于层次主题随时间变化情况进行技术演化分析。[方法 /过程]从专利术语中获取闭频繁项集,并基于此建立关联规则网络来度量术语的重要性和术语间语义关系强弱,进而对语料库进行重构,并对不同时间片段的专利集合进行层次主题结构抽取。[结果 /结论]将本方法应用于硬盘驱动器磁头领域的专利数据分析,实证结果表明该方法是一种可行和有效的技术演化分析方法。
- 陈亮张静张海超杨冠灿张健
- 关键词:主题模型
- 面向中文专利权利要求书的分词方法研究被引量:9
- 2014年
- 【目的】解决中文专利权利要求书分词问题,满足专利相似研究需求。【方法】总结中文专利权利要求书分割特征词、分割子串规则和术语抽取规则,构建领域词典,提出一种基于领域词典和规则相组合的分词方法。【结果】实验结果表明:分词的准确率为90%,召回率为95%,F值为92%。【局限】由于领域词典的庞大,使得大规模分词的效率降低。【结论】该方法能够进一步提高中文专利权利要求书的分词效果和效率。
- 张杰张海超翟东升
- 关键词:中文分词领域词典术语抽取
- 基于领域本体的专利信息检索研究
- 2014年
- 专利信息是当前知识经济时代最重要的战略资源之一。然而,传统的基于关键词的专利信息简单布尔检索所得的检索结果较粗糙不能满足专利分析人员的要求。本研究结合了局部分析法和领域本体的概念对初始检索表达式进行检索扩展,使得扩展后的检索表达式更加准确、全面地满足用户检索要求,以提高专利信息检索的效率。通过实验表明,该方法能在保障查准率的基础上有效提高检索的查全率和F指标。
- 张杰张海超翟东升孙武陈蕾
- 关键词:领域本体文本挖掘