徐硕
- 作品数:49 被引量:239H指数:10
- 供职机构:中国农业大学更多>>
- 发文基金:国家科技支撑计划国家自然科学基金中国科学技术信息研究所预研基金项目更多>>
- 相关领域:文化科学自动化与计算机技术理学语言文字更多>>
- 多任务最小二乘支持向量回归机及其在近红外光谱分析技术中的应用研究被引量:3
- 2011年
- 在近红外光谱定量分析中,许多模型分开考虑各种样品成分含量,失去了样品成分间潜在的联系。针对该问题,文章将建模分析每种样品成分含量的问题看作一个任务,将同时建模分析所有样品成分含量的问题转换为多任务学习问题。在LS-SVR的基础上,提出了多任务LS-SVR(MTLS-SVR),并给出一种有效的大规模问题求解算法。最后,以高粱样品数据集为实验材料,建立了三种样品成分(蛋白质,赖氨酸及淀粉)的同时定量分析模型。三种样品成分的预测值与实际值的平均相对误差分别为1.52%,3.04%和1.01%,相关系数分别为0.993 1,0.894 0和0.940 6,经分析比较,发现MTLS-SVR模型优于PLS,LS-SVR以及多因变量LS-SVR(MLS-SVR),从而验证了MTLS-SVR模型的可行性和有效性。
- 徐硕乔晓东朱礼军安欣张录达
- 关键词:近红外光谱化学计量学
- 一种基于N-最优阶次序列的无线传感器网络节点定位方法被引量:15
- 2010年
- 基于阶次序列的无线传感器网络(Wireless sensor networks,WSN)定位方法是一种新颖的高精度定位方法,该方法将定位空间划分为不同的子区域,每个子区域用一条阶次序列唯一标识.但该方法存在区域边界节点定位误差较大且不能保证平均定位误差最优.提出了一种基于N-最优阶次序列的节点定位方法.首先基于无线信号衰减模型产生虚拟测试点,以参考点为样本,通过随机采样确定最优N值,然后选择阶次位于前N位的序列所表示的子区域,对目标进行加权定位.文中完成了100个节点的仿真实验、15个ZigBee网络硬件节点的室外实验以及10个ZigBee硬件节点的防空洞模拟矿井应用实验.结果表明,本文方法有效地降低了平均定位误差,并改善了边界节点的定位精度.
- 裴忠民邓志东徐硕许潇
- 关键词:无线传感器网络
- 基于云计算的煤矿物联网一体化平台体系架构被引量:17
- 2012年
- 在总结煤矿安全生产管理信息系统发展历程的基础上,着眼于物联网、云计算等技术在煤矿领域的应用发展,提出了煤矿物联网一体化信息平台的概念,并对其特征进行了详细阐述;基于分层设计理念,给出了包含感知层、通信传输层、信息服务层和应用层4层结构的煤矿物联网一体化信息平台体系架构,介绍了每层结构的功能和组成。在此基础上,重点阐述了构建煤矿物联网一体化信息平台所涉及的现场感知与自组网、短距离无线通信、智能信息处理与服务、防爆设计等关键技术问题。
- 裴忠民李波徐硕朱华
- 关键词:物联网云计算体系架构信息平台
- 多因变量LS-SVM回归算法及其在近红外光谱定量分析中的应用被引量:11
- 2009年
- 以LS-SVM算法为基础,建立了权重可优化的多因变量LS-SVM回归模型,给出了相应的算法(MLS-SVM),并从理论上说明了它与LS-SVM的关系。以64个高粱样品为实验材料,其中建模集与预测集中样品的比例为51∶13。从区间[0,1]之间均匀地随机选取5组权重,根据预测平均相对误差最小的准则,按照LOO方式确定了一组合适的权重及参数,建立了近红外光谱同时分析三个化学组分蛋白质、赖氨酸和淀粉的多因变量定量分析模型。结果得到三个组分模型的预测值与实际值的平均相对误差分别为1.65%,6.47%和1.37%,相关系数分别为0.9940,0.83920.8825,而LS-SVM算法建模预测三个组分的平均相对误差分别为1.68%,6.25%和1.47%,相关系数分别为0.9941,0.8310和0.8800。可见MLS-SVM算法与LS-SVM算法的建模分析效果相当,且都取得了较满意的结果,验证了MLS-SVM算法同时定量分析多组分含量的可行性。另外,文章也验证了不同权重对MLS-SVM算法的预测性能有一定影响,由此表明在实际多因变量建模分析中对权重进行优化是必要的。
- 安欣徐硕张录达苏时光
- 关键词:LS-SVM近红外光谱
- 面向技术创新服务与DOI应用的国际合作——“第三届中日韩科技信息机构联合研讨会”概述被引量:2
- 2012年
- “第三届中日韩科技信息机构联合研讨会”于2012年5月14—15日在KISTI本部韩国大田市成功召开。与前两届对比,本次会议在交流的项目数、达成合作意向的项目数上都有所突破,说明中日韩之间的国际合作已进入了纵深发展期。文章首先简要介绍本次会议的整体情况;其次,基于中方最为关切的议题,详细介绍与技术创新服务和DOI应用相关的交流项目;最后,从成果和未来规划层面,描述会议达成的主要意向及下届会议的计划。
- 李颖徐硕朱礼军乔晓东
- 关键词:ISTICJSTFORESIGHT科学数据共享
- 仅根据Proximity数据构建向量空间模型的方法被引量:1
- 2011年
- 在实际应用中,许多研究对象都是抽象的,难以用某种特征向量的形式表示,这使得许多成熟的数据挖掘和机器学习方法难以被采用。不过,通常可将其转化成一个Proximity数据矩阵,使得矩阵中的元素表示两个对象间某种“比较”关系。针对该问题,本文提出仅根据Proximity数据矩阵利用多维尺度分析法(MDS)将研究对象进行向量化表示,即构建了一种向量空间模型。最后,对汉语科技词系统中的词语进行了聚类分析,结果表明,向量空间模型构建后再聚类的结果明显优于直接针对Proximity数据进行聚类分析的结果,从而验证了该方法的可行性和有效性。
- 徐硕乔晓东朱礼军郭怀恩
- 关键词:向量空间模型汉语科技词系统聚类分析
- 基于事实型数据的技术生命周期判断方法综述被引量:5
- 2013年
- 了解技术所处的生命周期,跟踪技术发展,是技术决策者的主要决策依据,也是整个技术发展变革中有力的事实支撑。文章从新的角度对技术生命周期各阶段进行划分,分析了科技论文和专利两大科研产出事实型数据的在各阶段的表现;随后归纳了常用的技术生命周期判断方法,分析各个方法的优缺点,并形成系统的方法体系。
- 王新乔晓东徐硕韩红旗
- 关键词:技术生命周期
- 科技文献术语的自动抽取技术研究与分析被引量:16
- 2014年
- 【目的】为提高科技文献信息的组织和检索效率,从解决科技文献术语抽取这一基础研究问题入手,提出一种基于科技文献术语特点和统计计算相结合的科技文献术语自动抽取方法。【方法】核心技术是结合科技文献术语的语言特点,以及术语在文献中的词语组合强度和出现位置等统计计算信息,构建科技文献术语自动抽取算法。【结果】实验测试结果表明,获取的科技文献术语词语的平均准确率可以达到51.2%。【局限】在统计计算算法和数据处理方面,还需进一步改进算法和提高数据质量。【结论】提出的基于科技文献术语特点和统计计算相结合的科技文献术语自动抽取方法是有效的。
- 曾文徐硕张运良翟娟华
- 关键词:自动抽取
- AToT模型可视化工具开发被引量:3
- 2016年
- 随着科研人员需要处理的文献集规模的日益庞大,以LDA为代表的主题模型能够从语义层面挖掘大规模文献集中隐含的主题,因此,LDA主题模型的应用越来越广泛。LDA模型仅仅关注文献集的内容,而忽略了文献其他重要的外部信息,AToT模型在LDA主题模型的基础上引入了文献作者和文献发表时间两个属性,使AToT模型不仅可以挖掘文献中隐含的信息,还可以分析文献作者的研究兴趣及文献主题随时间的变化。AToT模型对文献集建模的结果是以概率矩阵的形式呈现,不能直观、全面、清晰的呈现挖掘出来的信息,特别是对数据挖掘不熟悉的科研人员,因此,本文开发了一个基于AToT模型的可视化系统,该可视化系统清晰、美观地展现了AToT模型中文献、主题、作者、时间、词项间的关系。如文档中的主题分布、主题的词项分布、作者的研究兴趣分布、主题的相似主题和主题的演化趋势等。
- 孙国超徐硕乔晓东
- 关键词:LDA模型可视化DJANGO
- 基于专利文本数据的技术实力评价方法被引量:5
- 2014年
- 【目的】提出不依靠专利引文数据、利用专利文本数据评价企业技术实力的方法。【方法】该方法综合采用专利授权数量指标、专利增长率指标、技术中心性指标和专利最小价值指标来评估技术实力。这4类指标分别从技术规模、技术增长性、技术重要性和技术价值性等不同侧面反映一个企业的技术能力。【结果】通过CII和TII指标对比实验,验证引文分析给公开早的专利较高评价的问题;通过TS指标和TSQGIV对比实验,验证提出的技术实力评价方法的有效性。【局限】数据处理中没有对机构名称进行规范化处理,实验结果可能存在误差。【结论】相比于其他评价技术实力的方法,本研究可以在没有引文数据的情况下对企业的技术实力进行评价。
- 韩红旗桂婕徐硕刘玉琴
- 关键词:评价指标