毛伊敏 作品数:107 被引量:317 H指数:8 供职机构: 江西理工大学 更多>> 发文基金: 国家自然科学基金 江西省教育厅科学技术研究项目 江西省自然科学基金 更多>> 相关领域: 自动化与计算机技术 电子电信 天文地球 建筑科学 更多>>
不确定密度聚类分析算法的滑坡危险性评价 被引量:9 2019年 针对雨量值无法有效刻画及聚类算法难以适用地质地貌较复杂的大范围滑坡危险程度评估模型建立等问题,采用UM-Chameleon算法建立区域滑坡危险性评估模型,并对延安宝塔区进行评估,试验结果表明,评估结果与实际一致,体现出区内滑坡灾害发育的整体特点,证明该模型的有效性及研究区适用范围的宽广性;其滑坡预测成功率比M-Chameleon算法高,证明该模型能有效刻画雨量值,从而能有效地提高滑坡危险性预测精度。 毛伊敏 张茂省 李林 王根龙 王嘉炜关键词:滑坡 聚类算法 结合信息论和范数的并行随机森林算法 2022年 针对MapReduce框架下的随机森林算法在处理大数据问题时存在的冗余与不相关特征过多,训练特征信息量低以及并行化效率低等问题,提出了大数据下基于信息论和范数的并行随机森林算法(PRFITN)。首先,该算法基于信息增益和Frobenius范数设计了一种混合降维策略(DRIGFN),获得降维后的数据集,有效减少了冗余及不相关特征数;其次,提出了基于信息论的特征分组策略(FGSIT),根据FGSIT策略将特征分组,采用分层抽样方法,保证了随机森林中决策树构建时训练特征的信息量,提高了分类结果的准确度;最后,在Reduce阶段提出了一种键值对重分配策略(RSKP),获取全局的分类结果,实现了键值对的快速均匀分配,从而提高了集群的并行效率。实验结果表明,该算法在大数据环境下,尤其是针对特征数较多的数据集有更好的分类效果。 毛伊敏 耿俊豪关键词:MAPREDUCE框架 正确理解基带部分响应传输系统中的预编码原理 2005年 关于基带部分响应系统中的预编码原理的阐述,在国内几本主要的通信原理教科书中都存在明显的概念错误。主要的错误是对于什么时候要采用模N运算,什么时候采用普通的非模运算混淆不清。错误所在被指出,并详细阐述了有预编码的基带部分响应系统的原理。 王友村 毛伊敏关键词:通信技术 基于大数据的并行化深度卷积神经网络优化算法 被引量:3 2021年 针对并行DCNN算法在大数据环境下网络冗余参数过多、收敛速度慢和并行效率低的问题,提出了一种并行化深度卷积神经网络优化算法——PDCNNO(parallel deep convolutional neural networks optimization algorithm)。首先,该算法设计了基于特征图的剪枝策略(PFM),预训练网络,获得压缩后的网络,有效减少了冗余参数,降低了DCNN训练时间和空间复杂度;其次,设计了修正正割线的共轭梯度法(CGMSE),获取局部分类结果,实现了共轭梯度法的快速收敛,提高了网络的收敛速度;最后,在reduce阶段提出了控制负载率的负载均衡策略(LBRLA),获取全局分类结果,实现了数据的快速均匀分组,从而提高了并行系统的加速比。实验表明,该算法不仅降低了DCNN在大数据环境下训练的时间和空间复杂度,而且提高了并行系统的并行化性能。 毛伊敏 张瑞朋 曹文梁关键词:MAPREDUCE框架 基于模糊谱聚类的不确定PPI网络功能模块挖掘方法 本公开提供一种基于模糊谱聚类的不确定PPI网络功能模块挖掘方法包括以下步骤:去掉蛋白质相互作用数据中的重复相互作用和自相互作用,利用边聚集系数来测度每一组相互作用,构建不确定蛋白质相互作用网络图;利用流行距离和蛋白质网络... 毛伊敏 刘银萍 毛丁慧文献传递 基于网格密度和局部敏感哈希函数的并行化聚类算法 被引量:4 2021年 针对大数据背景下基于划分的聚类算法中存在初始中心敏感,节点间通信开销大以及集群效率低下等问题,提出了基于网格密度和局部敏感哈希函数的PBGDLSH-MR并行化聚类算法。首先,对初始数据集提出网格密度策略(GDS)获取初始中心点,有效避免了随机选取引起的初始中心敏感的问题;其次,提出基于局部敏感哈希函数的数据分区(DP-LSH)用于投射关联性较大的数据对象到同一子数据集中,得到map上的数据分区,并设计相似性度量公式(SI)对数据分区结果进行评价,从而降低了节点间的通信开销;接着设计自适应分组策略(AGS)处理数据分区中数据倾斜的问题,进而有效地提高了集群效率;最后,结合MapReduce计算模型并行挖掘簇中心,生成最终聚类结果。实验结果表明,PBGDLSH-MR算法的聚类效果更佳,同时在大数据环境下能有效地提高并行计算的效率。 毛伊敏 陶涛 曹文梁关键词:哈希函数 MAPREDUCE 基于数据流挖掘技术的入侵检测模型与算法 被引量:6 2011年 针对目前基于数据流关联规则挖掘技术的入侵检测系统响应速度不够快和检测精度不够高的问题,提出一个基于数据流最大频繁模式的入侵检测系统模型MMFIID-DS;设计各种剪枝策略,挖掘经过训练学习后的正常数据集、异常数据集和当前检测数据流的最大频繁项集,建立系统的正常行为模式、异常行为模式和用户行为模式,达到极大缩小搜索空间的目的,提高系统的响应速度;结合误用检测和异常检测2种入侵检测方法进行实时在线检测入侵,提高系统的检测精度。理论与实验结果表明:MMFIID-DS入侵检测系统具有较好的性能。 毛伊敏 杨路明 陈志刚 刘立新关键词:数据流 最大频繁项集 异常检测 误用检测 改进的数据流频繁闭项集挖掘算法 被引量:5 2011年 为提高数据流频繁闭项集的查找效率,提出一种改进的NewMoment频繁闭项集挖掘算法,通过在LevelCET数据结构中加入层次结点,并利用层次检测策略与最佳频繁闭项集检测策略快速挖掘数据流滑动窗口中所有的频繁闭项集。实验结果证明,与NewMoment算法相比,改进的算法性能更优。 刘洁 杨路明 毛伊敏 刘立新 谢东关键词:数据流 频繁闭项集 基于人工智能(AI)的地质灾害防控体系建设 被引量:22 2019年 近年来,人工智能(AI)技术得到快速发展,并日益融入到经济社会各个领域,成为当代创新发展的新标志,智能防灾减灾将成为未来发展的趋势和研究的热点。在回顾AI发展现状与趋势的基础上,系统梳理出以往地质灾害风险防控的数据依据和传统技术方法,分析了可能采用的潜在AI方法,初步搭建了基于AI的地质灾害风险防控体系建设方案。研究表明,AI技术为地质灾害风险防控提供了新的技术途径,但目前尚无可照搬或可移植的成熟技术或解决方案。智能防灾减灾体系包括早期识别、风险评估、风险防控等3个主要环节,其中最重要的环节是早期识别,传统方法与AI技术融合的关键参数为斜坡失稳概率或泥石流发生概率;根据所依据的数据资料将早期识别方法归纳为图像识别、形变识别、位移识别、内因识别、诱因识别和综合识别等6种方法;提出了从数据层、方法层和应用层3个层次构建基于大数据智能混合优化的地质灾害风险防控平台。认为数据驱动的智能模型与理论驱动的物理模型融合是地质灾害风险防控发展的趋势。 张茂省 贾俊 王毅 牛千 毛伊敏 董英关键词:人工智能 PYTHON 地质灾害 防控体系 结合信息论改进的并行深度森林算法 被引量:1 2022年 针对并行深度森林算法在处理大数据问题时存在的冗余与不相关特征过多,多粒度扫描不平衡以及并行化效率低等问题,提出了大数据环境下基于信息论改进的并行深度森林算法——IPDFIT(improved parallel deep forest based on information theory)。该算法基于信息论设计了一种混合降维策略DRIT(dimension reduction based on information theory),以获得降维后的数据集,有效减少了冗余及不相关特征的数量;提出了一种改进的多粒度扫描策略IMGSS(improved multi-grained scanning strategy)对样本进行扫描,保证每个特征在扫描后,同频率出现在数据子集中,避免了因多粒度扫描不平衡对深度森林模型的影响;结合MapReduce框架,对深度森林每层级联结构中的随机森林模型进行并行化训练,同时提出了一种样本加权策略TSWS(the sample weighting strategy),根据级联中随机森林模型对样本进行评估,选取评估结果较差的样本进入下一层训练,逐步减少了每层级中训练样本的数量,从而提高了算法的并行效率。实验结果表明,该算法在大数据环境下,尤其是针对特征数较多的数据集有着更好的分类效果。 毛伊敏 耿俊豪 陈亮关键词:MAPREDUCE框架