卫琳
所属机构: 郑州大学 所在地区: 河南省 郑州市 研究方向: 自动化与计算机技术 发文基金: 国家自然科学基金
相关作者
石磊 作品数:198 被引量:611 H指数:13 供职机构:郑州大学 研究主题:WEB缓存 WEB预取 自适应 MAPREDUCE WEB对象 陶永才 作品数:70 被引量:241 H指数:8 供职机构:郑州大学 研究主题:MAPREDUCE 文本分类 云计算 作业调度 个性化推荐 曹仰杰 作品数:124 被引量:200 H指数:8 供职机构:郑州大学 研究主题:非接触式 感知 自适应 毫米波雷达 无线 古志民 作品数:92 被引量:851 H指数:8 供职机构:北京理工大学 研究主题:线程 多核 WEB缓存 WEB预取 缓存 石云 作品数:17 被引量:183 H指数:8 供职机构:国家邮政局 研究主题:WEB缓存 OLAP 数据库 数据挖掘 WEB预取
一种改进的MapReduce互信息文本特征选择机制 被引量:7 2018年 文本分类是数据挖掘的重要环节,而特征选择又是文本分类的核心步骤,互信息方法是常用的特征选择评价函数,但该方法过于简单,分类精度相对较低.基于此,本文提出一种基于MapReduce的互信息文本特征选择机制,一方面对传统的互信息计算公式进行改进,并且引入熵的思想对公式计算加以修正,使特征词选择更加得当,从而提高后期分类精度;另一方面引入MapReduce技术,利用其处理大规模数据的优势,缩短文本训练和分类的过程.实验表明基于MapReduce的互信息文本特征选择机制可以显著提高文本分类的精度,而且明显提升执行效率. 陶永才 赵国桦 石磊 卫琳关键词:文本分类 特征提取 互信息 云计算 MAPREDUCE 一种redis数据库的拟态调度设计方法 本发明公开了一种redis数据库的拟态调度设计方法,包括交互模块、执行体数据库池、裁决器和aof/rdb编辑器,还包括如下步骤:步骤S1:初始化阶段,定义目前支持的命令的命令类型,确保各模块进程容器的连接正常;步骤S2:... 石磊 靳业成 高宇飞 卫琳 谷晶中 姚金龙一种便于拆卸的计算机网络安全用机 本发明公开了一种便于拆卸的计算机网络安全用机,包括安装机架、辅助基座、安全组件、连通组件、显示组件和定位组件,所述安装机架的顶部端面固定安装有辅助基座,所述辅助基座的顶部一侧设置有连通组件,所述辅助基座的顶部另一侧设置有... 卫琳 石磊 陶永才 和孟佯 高宇飞 刘永光 姜伟 许朋举基于语义相似度与信息量的Web服务标签优化 被引量:1 2015年 Web服务标签是用户向Web服务添加的描述其功能或属性的关键词,用来提高服务相似度计算的准确率进而改善服务发现、服务组合和服务聚类等.目前不准确甚至错误的无效标签比例较高,影响了服务相似度计算的准确率.为此,提出一个Web服务标签优化模型WS-TOM,分析了Web上已有WSDL文档,给出一种考虑到编程风格和命名规范的特征提取方法,用于Web服务相似度计算;然后综合标签与WSDL的语义相似度和标签的信息量来对标签进行排名,降低不准确标签的影响.实验结果及分析验证了WS-TOM模型能够提高Web服务相似度计算的准确率. 石磊 谢涛 曹仰杰 卫琳 陶永才关键词:WEB服务 相似度计算 标签 语义相似度 一种结合LSTM和集成算法的文本校对模型 被引量:11 2020年 伴随着互联网的飞速发展,各行各业产生了大量的电子文本数据,但是这些文本经常存在语义错误,数据质量良莠不齐,如何提高电子文本的质量是亟待解决的难题.本文设计一种基于集成算法和长短时记忆网络的集成模型,提高语义特征检测和校对的准确性.主要工作分为三部分:(1)使用神经网络和HowNet学习词语-义原之间的搭配关系;(2)将抽象化信息输入至长短时记忆网络集成模型,预测语义搭配关系;(3)结合模糊匹配方法,依据聚合度对预测结果投票并排序,将排名靠前的结果作为校对建议输出.实验结果显示,本文提出的校对模型和算法与其他文献相比在检错准确率和校对准确率上分别提高了1.8%和2.3%. 陶永才 吴文乐 海朝阳 石磊 卫琳关键词:文本校对 一种可信的车联网区块链数据共享模型 被引量:5 2021年 车联网大数据时代的兴起,信任问题已经成为大数据面临的最大问题,它对数据安全流通和车联网产业发展造成影响.以区块链作为数据共享的平台是当下研究的热点,在车联网中发挥着重要作用.结合区块链及雾计算服务器更好地实现车辆私有数据的存储和共享问题,同时为保证数据的可靠性及减少车辆与被授权的第三方组织和个人共享数据时的频繁交互,结合无证书代理签密技术,本文提出一个基于区块链的车联网数据共享模型.通过分析发现,该模型不仅在通信开销与算力方面耗能较少,而且在安全性上有良好的表现,具有可靠的实现性. 陶永才 李哲 石磊 卫琳 卫琳关键词:车联网 无证书密码体制 代理签密 一种基于可用性的动态云数据副本管理机制 被引量:5 2018年 副本是提高云存储数据可用性的关键技术之一.为提供低成本高效益的可用性,并提高云存储的性能和负载均衡,本文提出一种动态副本管理机制DRM(Dynamic Replica Management scheme).DRM研究确定数据可用性和副本数之间的关系模型,并利用此模型来动态计算和维护给定可用性要求的最小副本数,并基于节点性能和用户访问特性确定副本放置位置.根据节点规模变化,DRM动态调整副本数量以确保数据可用性需求.DRM在节省资源成本的前提下,提高了云存储的性能和负载平衡.本文在HDFS(Hadoop Distributed File System)上实现了DRM,实验结果表明DRM在成本、负载平衡和性能都优于现有HDFS副本管理机制. 陶永才 巴阳 石磊 卫琳关键词:数据副本 可用性 中文词语搭配特征提取及文本校对研究 被引量:10 2018年 随着网络的快速发展,电子文本正在人们的生活中发挥着越来越重要的作用,但是电子文本中存在着大量的字词错误以及语法错误,亟需有效的校对方法来提高电子文本的质量.本文提出一种基于词语搭配关系的文本校对方法,包括构建语法-词语搭配双层知识库以及基于互信息和聚合度双重评价条件下的词语搭配校对算法.知识库的构建主要分为语法和词语搭配两部分:(1)从训练语料中抽取并分析语句结构成分,构建语法成分知识库;(2)从训练语料中学习词语之间的搭配关系,利用共现频数和互信息进行筛选,构建词语搭配知识库.在此基础上,综合使用互信息和聚合度评价词语关联强度,进行词语搭配关系校对.实验结果显示,本文所提出的校对模型和算法的F值与其他文献相比提高了3.9%. 陶永才 海朝阳 石磊 卫琳关键词:文本校对 知识库 语法分析 MapReduce在线抽样分区负载均衡研究 被引量:5 2017年 数据倾斜一直是影响MapReduce性能的关键问题之一.为缓解数据倾斜问题,提出一种基于抽样分区的MapReduce在线负载均衡机制:MR-LSP(MapReduce on-line Load balancing mechanism based on Sample Partition).MR-LSP在作业执行之前,通过对源数据抽样分析,预测数据的分布特征,动态采取相应的负载均衡数据分区策略;在作业运行期间实时监控节点负载,进一步动态优化数据分区策略.实验结果表明:MR-LSP能够提高系统3.2%的负载均衡,降低4.3%的作业执行时间,有效缓解了MapReduce的数据倾斜问题. 陶永才 丁雷道 石磊 卫琳关键词:动态调度 大数据嵌入式网络分析特定数据检测方法研究 2016年 对大数据嵌入式网络中特定数据准确检测,可以提高数据处理的效率。大数据嵌入式网络中的经常会加入一些外部数据,不断更新网络中特定数据的检测特性,而传统的基于特征的检测方法难以判断特定数据的更新频率,需要反复通过跳动窗口形式对特定数据的检测特性进行比较,降低了特定数据检测效率和精度。提出采用链距离估计的大数据嵌入式网络分析中特定数据检测方法,先利用链距离估计定义大数据嵌入式网络中特定数据的离群因子概念,提取特定数据主特征量,计算出特定数据检测概率密度值,得到基于链距离估计的特定数据检测的预测值,并融合于分数阶Fourier变换进行特定数据特征匹配处理,进行特定数据分类空间引导,构建K-L特定数据分类器,利用上述分类器实现了大数据嵌入式网络分析中特定数据检测。仿真结果证明,改进算法能有效提高大数据嵌入式网络分析中特定数据检测性能。 韩颖 姚瑶 卫琳关键词:嵌入式