中国博士后科学基金(201003797) 作品数:30 被引量:170 H指数:7 相关作者: 刁兴春 曹建军 刘艺 陈爽 高科 更多>> 相关机构: 解放军理工大学 总参第六十三研究所 国防科技大学 更多>> 发文基金: 中国博士后科学基金 国家自然科学基金 江苏省博士后科研资助计划项目 更多>> 相关领域: 自动化与计算机技术 军事 电子电信 兵器科学与技术 更多>>
基于蚁群参数优化的LightGBM辐射源个体识别 被引量:8 2023年 为提升辐射源个体识别正确率和运算效率,提出了一种基于蚁群参数优化的LightGBM辐射源个体识别方法。运用提升小波包变换对辐射源信号数据进行特征提取并构建特征参数体系,对得到的特征数据集进行Z-score标准化处理;以最大分类正确率和最小特征子集规模为目标,建立了LightGBM参数优化和特征选择的数学模型;采用蚁群算法优化LightGBM的6个参数(最小叶子节点数据量、决策树的数量、学习率、L_(1)正则化项的权重、L_(2)正则化项的权重和最小叶子节点样本权重和);根据优化后的LightGBM得到每个特征的重要性值并使用序列后向搜索策略进行特征选择;最后通过LightGBM分类器实现对辐射源信号的分类识别。实验结果表明,所提方法在无噪声、信噪比为10 dB和信噪比为5 dB信号的数据集上的识别正确率优于对比特征选择方法GBDT、XGBoost和LightGBM的,同时特征维数的减少也提升了辐射源个体识别的运算效率。 顾楚梅 曹建军 王保卫 徐雨芯关键词:辐射源个体识别 蚁群算法 基于胶囊网络的文本数据真值发现 被引量:1 2023年 为解决传统真值发现算法无法提取文本数据关键语义信息的问题,提出一种基于胶囊网络的文本数据真值发现算法(Truth Discovery of Text Data Based on Capsule Network,Caps-Truth),对传统卷积神经网络(Convolutional Neural Network,CNN)进行改进,在神经网络模型中构造语义胶囊层替代CNN池化层表征文本语义信息。首先通过CNN卷积层获取文本数据全局特征,利用初级胶囊层将特征信息向量化,再通过语义胶囊层表征文本数据细粒度语义信息,将特征向量输入全连接神经网络挖掘文本数据可信度并获得可靠答案。上述算法在真值发现中引入胶囊网络,利用动态路由算法整合零散语义,有效提高了文本数据真值发现的效果。实验结果表明,Caps-Truth算法优于对比算法。 陶嘉庆 樊树海 曹建军 常宸关键词:数据质量 神经网络 文本数据 基于有损差分聚合的单向时延测量方法 被引量:1 2013年 为了提高数据中心网络单向时延测量精度,更好地满足性能监测需求,用软件的方式实现有损差分聚合测量方法,以求只需发送少量控制报文就能测量任意端到端的单向时延,并消除丢包对时延结果产生的影响。设计搭建数据中心仿真环境进行实验,结果表明,该测量方法可以获得微秒级的精度结果,跟常用的测量方法相比可降低对网络的影响,部署代价低且使用方便。 刁兴春 刘艺 丁鲲 邓波关键词:数据中心网络 多目标蚁群优化研究综述 被引量:11 2017年 多目标蚁群优化是一类重要的多目标进化算法,它在解决多目标优化问题,尤其是多目标组合优化方面,具有优异的性能。首先,通过总结多目标蚁群优化的研究成果,将多目标蚁群优化分为基于帕累托的方法、基于指标函数的方法和目标分解法3类,并阐述了每类方法的特点和代表性算法;然后,展现了多目标蚁群优化在实际问题中的广泛应用;最后,探讨了目前多目标蚁群优化存在的问题。 刁兴春 刘艺 曹建军 尚玉玲关键词:多目标进化算法 帕累托优化 基于集成分类的高维数据实体分辨 被引量:3 2018年 针对高维数据实体识别问题,为了有效利用高维特征的富信息,提高分辨性能,提出一种随机组合集成分类器。定义基分类器的分类性能指标,将分类正确性和特征子集的个数作为设计基分类器两个目标,使用聚合函数将其转换为单目标优化问题。采用蚁群优化求解基分类器模型,提出利用最大信息系数度量特征的相关性作为蚁群优化启发式信息,使用谷元距离度量选择特征多样性差异最大的基分类器组合集成分类器,集成分类器的决策函数采用投票表决输出。在标准数据集上进行验证与对比,结果表明了该方法的有效性。 刘艺 刁兴春 曹建军 尚玉玲关键词:高维数据 集成分类器 蚁群优化 挖掘机构别名的Jaccard相似度数据空间转换方法 2018年 针对同一机构实体对应多个机构名称的问题,提出了一种基于Jaccard相似度数据空间转换的机构别名挖掘方法。根据机构与作者间的隶属关系,建立机构-作者二部图模型;采用Jaccard相似度度量两机构名称所对应作者姓名集合间的相似度;根据机构间的相似度矩阵,将集合型数据转换成数值型数据;通过计算机构名称对应的相似度向量间的余弦相似度,实现了机构别名的有效挖掘。最后用真实数据进行对比实验验证了该方法的优越性。 尚玉玲 曹建军 李红梅 刘艺关键词:余弦相似度 求解子集问题的鲶鱼效应蝙蝠蚁群优化 被引量:5 2016年 为求解子集问题,提出一种新的基于图的蚂蚁系统——鲶鱼效应蝙蝠蚁群优化(catfish bat algorithm-ant colony optimization,CBA-ACO)。基于子集问题的构造图,利用路径概率转移公式进行路径搜索,采用等效路径信息素增强进行信息素更新;动态维护一定数量较好路径作为档案信息;使用混沌映射并结合鲶鱼效应对蝙蝠算法(bat algorithm,BA)进行改进,在全局最优解多次未更新时,利用档案信息初始化鲶鱼效应增强搜索,返回较好路径解;采用本轮迭代最优更新和增强搜索更新两种方式更新信息素,兼顾算法的收敛速度和搜索能力。对算法进行了描述并分析算法复杂度。结果表明,CBA-ACO具有更好的稳定性和获取较好解的能力。 刘艺 刁兴春 曹建军 丁鲲 许永平关键词:鲶鱼效应 混沌映射 基于开项集剪枝的常量条件函数依赖挖掘 被引量:1 2016年 为了减小常量条件函数依赖的搜索空间,提高挖掘效率,针对常量条件函数依赖挖掘算法CFDMiner,提出了一系列剪枝优化策略。理论研究发现,CFDMiner的输入——关系数据的全部开项集和闭项集对产生有效的常量条件函数依赖仍然存在很多无效、冗余的项集。从理论上证明了通过合理剪枝,选取开项集的子集与对应的闭项集,能够得到与原算法一致的结果。实验表明:相比原始算法CFDMiner,优化后的算法搜索空间更小,实际数据集上平均挖掘效率提高4~5倍。 周金陵 刁兴春 曹建军关键词:条件函数依赖 函数依赖 闭项集 剪枝 数据清洗及其一般性系统框架 被引量:31 2012年 数据清洗是提高数据质量的重要手段之一。从数据产品与传统的有形产品、软件产品相类比的视角,研究数据清洗及其系统框架。数据清洗是数据质量研究的起点,从数据质量发展的角度明确数据清洗的地位和作用,并将其类比为其他产品形式的故障诊断与维修。对数据清洗做了10点说明,进一步澄清了其基本内涵;将数据清洗与数据集成进行了比较分析,指出二者是同等的数据质量概念。提出了数据清洗的一般性系统框架,其由准备、检测、定位、修正、验证5部分组成,允许在多处停止以完成不同的数据清洗任务,是一个柔性的、可扩展的、交互性好的、松耦合的框架。 曹建军 刁兴春 陈爽 邵衍振关键词:数据质量 数据清洗 相似重复记录 基于简单规则的数据质量检查系统设计与应用 被引量:5 2015年 为了更加全面地对数据存在的质量问题进行检查,并找出其中的问题数据,分析了数据质量评估的一般性指标,从规则约束的角度对关系型数据字段的格式、语法、长度、取值范围,以及字段与字段之间的逻辑关系、函数依赖关系等进行分类描述,设计相应的数据质量检查算法并进行编码实现,形成一套完整的数据质量检查工具。对某单位的设备人员信息数据从完整性、规范性、一致性、有效性等方面进行检查。实验结果表明,这些规则能够有效检出关系型数据中存在的问题。 高科 刁兴春 曹建军关键词:数据质量 关系型数据