周晓磊
- 作品数:5 被引量:29H指数:3
- 供职机构:中国科学院沈阳计算技术研究所更多>>
- 发文基金:国家科技重大专项沈阳市科技计划项目辽宁省科学技术计划项目更多>>
- 相关领域:自动化与计算机技术环境科学与工程政治法律水利工程更多>>
- 基于SVM-BiLSTM-CRF模型的财产纠纷命名实体识别方法被引量:13
- 2019年
- 裁判文书中的命名实体识别是自动化审判的关键一步,如何能够有效的分辨出案件的关键命名实体是本文的研究重点.因此本文针对财产纠纷审判案件,提出了一种基于SVM-BiLSTM-CRF的神经网络模型.首先利用SVM筛选出包含关键命名实体的句子,然后将正确包含此类实体的句子转化为字符级向量作为输入,构建适合财产纠纷裁判文书命名实体识别的BiLSTM-CRF深层神经网络模型.通过构建训练数据进行验证和对比,该模型比其他相关模型表现出更高的召回率和准确率.
- 周晓磊赵薛蛟刘堂亮宗子潇王其乐里剑桥
- 关键词:命名实体识别SVMCRF
- 联合知识的融合训练模型被引量:1
- 2021年
- 在互联网医疗领域,智能AI分科室是一个很关键的环节,就是根据患者病情描述、疾病特征、药品等信息将患者分配到匹配的科室,可以利用深层双向Transformer结构的BERT预训练语言模型增强字的语义,但是患者病情文本描述具有信息稀疏的特点,不利于BERT的充分学习其中特征.本文提出了一种DNNBERT模型.是一种融合知识的联合训练模型,DNNBERT结合了神经网络(DNN)和Transformer模型的优势,能从文本中学习到更多的语义.实验证明DNNBERT的计算时间相比BERT-large速度提升1.7倍,并且准确率比ALBERT的F1值提高了0.12,比TextCNN提高了0.17,本文的工作将为特征稀疏学习提供新思路,也将为基于深度Transformer的模型应用于生产提供新的思路.
- 王永鹏周晓磊马慧敏曹吉龙无
- 关键词:知识融合文本分类
- 基于改进FA算法的河流突发水污染事件溯源被引量:3
- 2022年
- 针对河流突发水污染事件的溯源问题,利用正向和逆向质量概率密度之间的耦合关系,实现污染源的位置、排放时间和污染源排放强度之间解耦,并结合一维水体扩散模型和美国特拉基河示踪剂实验监测数据,建立了基于改进萤火虫算法的河流突发水污染事件溯源求解方法.在求解过程中将监测数据划分为训练集和实验集,通过训练集数据利用改进的萤火虫算法对河流的水文参数进行调整,在实验集采用调整后的水文参数,并通过不同监测断面数据独立求解,通过方差分析结果,排除了溯源误差较大的监测断面数据.研究结果表明,溯源结果精度较高,并具有对监测数据的纠错能力,对实际河流突发水污染事件具有一定的指导意义.
- 赵栋梁周晓磊窦志强武暕
- 关键词:河流突发水污染
- 数据融合技术在环境监测领域的应用被引量:10
- 2016年
- 在省级环境监测系统中随着时间的累积有大量数据,并且监测数据种类繁多,不同环境指标的描述信息也有很大差别,同时监测数据又是每分每秒不断增加的,这样就增加了数据的复杂性.而数据融合技术则是大数据技术中处理数据的一种方式,可以将来自多传感器的数据通过数据转换、数据相关和融合计算过程,对数据处理、分析并进行态势分析.同时利用到了大数据ETL技术、Map Reduce处理,使用D-S证据推理算法进行融合推理,这样就可以增加数据的相关性,降低数据的规模.
- 刘卫萍王宁周晓磊张镝
- 关键词:数据融合数据转换数据相关MAPREDUCE
- 基于大数据的水生态承载力分析模型被引量:2
- 2020年
- 随着科学技术的发展,水文信息数据量发生了巨大的增长,如何充分利用这些支持决策的大规模数据,是当前科学家面临一个大问题.传统的水生态承载力分析计算复杂多样,涉及的数据种类多样,扩展性不强,注重于理论研究和分析,本文通过研究历史数据,分析影响水生态承载力的因素,将数据划分为3个指标层,提出一种基于大数据的水生态承载力分析模型(ECCBD).利用Hadoop集群的HDFS分布式文件系统实现水生态数据的备份存储,利用MapReduce实现海量水生态数据的并行计算.通过输出值与水生态承载力对比,判断水资源是否盈余或赤字,本文提出的方法和模型能够从压力、承载力、弹性力3个不同的指标层有效分析水生态环境现况,对提供水生态保护依据上有重要意义.
- 周晓磊房萌刘枢姜秋俚金继鑫宋春梅陈月王兴刚毛立爽
- 关键词:HADOOPMAPREDUCE水生态承载力