福建省高等学校新世纪优秀人才支持计划(JA13021) 作品数:34 被引量:220 H指数:8 相关作者: 郭昆 郭文忠 陈羽中 刘漳辉 李国辉 更多>> 相关机构: 福州大学 教育部 国网信通亿力科技有限责任公司 更多>> 发文基金: 福建省高等学校新世纪优秀人才支持计划 国家自然科学基金 福建省科技创新平台建设项目 更多>> 相关领域: 自动化与计算机技术 电气工程 经济管理 理学 更多>>
基于改进随机森林算法的停电敏感用户分类 被引量:7 2019年 目前,我国电网企业对于识别停电投诉风险,开展用户停电敏感程度分析的研究工作还处在起步阶段.为了有效地分析停电用户的敏感程度,提出了一种基于改进随机森林算法的停电敏感用户分类算法.首先,对原始数据进行清洗、特征选择等预处理;接着,采用SMOTE算法增加少数敏感用户样本数据量,解决数据分布不均匀问题;然后,以Fisher比作为特征的重要性度量,按比例随机采样选取具有代表性的特征构成子特征空间;最后,利用随机森林算法识别停电敏感用户.通过在真实停电数据上的实验,验证了提出的方法不仅具有较好的准确性和时间性能,而且可以有效处理高维、冗余特征的数据. 谢国荣 郑宏 林伟圻 徐鸣 郭昆 陈基杰关键词:不平衡数据 FISHER准则 融入节点重要性和标签影响力的标签传播社区发现算法 被引量:7 2015年 近年来,高质量社区的挖掘和发现已经成为社会网络研究一个热点.其中,基于标签传播的社区挖掘算法(Label Propagation Algorithm,简称LPA)由于具有近似线性时间复杂度且无须预先定义目标函数和社区数量等优点而得到广泛关注.但是,LPA算法的标签传播过程存在不确定性和随机性,影响了社区发现的准确性和稳定性.提出一种新的基于标签传播的社区发现算法LPA_SI(Label Propagation Algorithm based on Significance and Influence).首先,采用新的节点重要性度量方法对节点进行排序;其次,提出一种新的标签影响力计算方法更新每个节点的标签;最后,在真实数据集和人工数据集上的实验表明,LPA_SI在复杂度相近的情况下能够显著提高社区发现的质量,并具有较好的稳定性. 黄佳鑫 郭昆 郭红关键词:社会网络 基于层次嵌入的方面抽取模型 2020年 方面抽取旨在抽取评论文本中观点持有者所评价的实体属性,是细粒度情感分析的一项重要基本任务。现有的研究大多基于规则或传统机器学习模型,具有简单易行和较高性能等优点,但需要花费较多的精力来人工构建规则模板或者特征工程。为了提高模型自动化,提出一种基于层次嵌入的方面抽取模型。首先,对原始语料执行多阶段的预处理操作;然后,使用字符层次的嵌入和双向循环神经网络获得词的高层次特征;最后,通过级联词嵌入与字符嵌入特征以作为词层次双向循环神经网络的输入,获得最终标注结果。实验结果表明,该模型明显优于基于规则和传统机器学习模型的方法,也优于单层神经网络模型。 刘漳辉 肖顺鑫 郑建宁 郭昆关键词:循环神经网络 情感分析 基于随机森林算法的配网抢修故障量预测方法 被引量:7 2016年 配网抢修是电力系统运行环节中十分重要的一环,精益化的配网抢修管理不仅能提高电力系统的供电服务质量,也能减少电力公司的经济损失.本文提出一种新的配网抢修故障数量预测的方法.首先,基于历史数据,以气温、风力、前一天的故障量、最大最小负荷等作为因变量,对数据做了特征映射等预处理.然后,应用随机森林算法建立配网抢修故障量预测模型,并预测不同区域、不同电网故障及非电网故障、不同电压维度下未来一天故障量.在真实电力数据上进行了对比验证,实验结果表明提出的方法具有较好的预测效率和准确性. 程淼海 楼俏 王琼 王国军 胡殿刚 李韶瑜关键词:电力系统 精益化管理 基于并行分类算法的电力客户欠费预警 被引量:11 2016年 针对供电企业先消费后付款的经营模式可能造成用电客户因失信引发的欠费风险,需要在用电客户欠费行为发生之前实时快速地分析海量的用电用户的数据,给出潜在的欠费客户名单的问题,提出一种基于并行分类算法的电力客户欠费预警方法.首先,该方法使用基于Spark的随机森林(RF)分类算法对欠费用户进行建模;其次,根据用户以往历史用电行为和缴费记录使用时间序列进行预测得到其未来用电和缴费行为特征;最后,使用之前得到的模型对用户进行分类得到未来潜在高危险欠费用户.将该方法与并行化后的支持向量机(SVM)算法和在线序列极限学习机(OSELM)算法进行对比分析,实验结果表明,所提方法相对于对比算法在准确率上有较大提高,便于电费回收管理人员进行提前催缴,确保电费回收的及时性,有利于电力企业进行客户欠费风险管理. 陈羽中 郭松荣 陈宏 李婉华 郭昆 黄启成关键词:时间序列 海量数据 囚徒困境博弈策略在社团网络中的演化 被引量:1 2015年 为深入探讨社团网络的网络拓扑结构如何影响合作的演化和维持,在社团网络框架下,进行重复囚徒困境博弈.模拟结果表明了社团强度Q明显影响了群体的合作情况,具有适当社团强度的网络,可以促进合作的形成,且具有较高聚类系数的网络能激励合作行为的演化.当网络平均度越大,越无益于合作行为的产生. 陈雅姗 郭文忠关键词:博弈论 一种提高任务QoS的WSNs自适应资源分配方法 被引量:1 2015年 在无线传感器网络中,针对资源分配过程中保证任务Qo S问题,当前主副版本技术在容错过程未考虑任务Qo S均衡和分配过程中未考虑节点能耗和均衡.本文针对改进当前主副版本技术的不足,既考虑先前主副版本技术中的性能,又同时考虑任务Qo S均衡和节点能量均衡,并结合非完全信息博弈竞标算法提出一种基于改进的主副版本技术提高任务Qo S的无线传感器网络资源分配方法.实验仿真结果表明,该方法较先前的主副版本技术能得到更好的系统容错率,同时又能提高任务Qo S均衡率和节点能量均衡率. 张顺华 刘漳辉 郭文忠关键词:资源分配 WSNS 基于时态密度特征的改进数据流聚类算法 被引量:14 2018年 针对经典Clu Stream聚类算法的在线微簇聚类过程中限制微簇数量的增长,对微簇进行强制合并,使其在线聚类结果受到影响,导致数据流聚类质量不高,且难以适应海量大数据等问题,提出一种基于时态密度特征的改进Clu Stream聚类算法.首先,提出微簇时态密度的概念,并用其对微簇进行描述;其次,提出新的微簇删除、合并的机制,能够根据在线微簇的情况动态地添加微簇的数量;最后,应用并行化的框架将算法并行化,以适应海量实时大数据的需求.通过在人工数据集和真实数据集上的对比实验表明,改进后的数据流聚类算法相较于Clu Stream算法能够得到更高质量的聚类结果. 陈羽中 郭松荣 郭昆 郭昆 林魏超关键词:数据流 聚类 并行计算 无线传感器网络中带复杂联盟的自适应任务分配算法 被引量:10 2014年 针对无线传感器网络任务调度的实时性及节点计算及能量受限的特点,根据任务截止期赋予任务优先级,优先考虑高优先级任务,设计了一个无线传感器网络中带复杂联盟的自适应任务分配算法。为尽最大努力确保任务在截止期前完成,对截止期较为紧迫的任务采用历史信息生成历史联盟,并执行快速子任务分配算法;而对截止期较为宽裕的任务,在满足任务截止期约束条件下,以节点能耗和网络能量分布平衡为优化目标,采用矩阵的二进制编码形式,设计了一种离散粒子群优化算法以并行生成联盟,并执行基于负载和能量平衡的子任务分配算法。仿真实验结果表明所构造的自适应算法是有效的,在局部求解与全局探索之间能够取得较好的平衡,并能够在较短的时间内取得满意解。 郭文忠 苏金树 陈澄宇 陈国龙关键词:无线传感器网络 粒子群优化 一种融合信息选择和语义关联的文本摘要模型 被引量:2 2020年 近年来随着大型文档-摘要语料库的公开和深度学习技术的兴起,基于Seq2Seq和注意力模型的文本摘要算法取得重大成效,然而生成的摘要在准确性方面仍存在不少问题。提出一种融合信息选择和语义关联的文本摘要模型,旨在综合改善生成摘要中存在的未登入词、句子重复、信息冗余以及生成摘要的语义与原文的语义存在偏差甚至大相径庭等问题。模型设计了一种选择网络对编码器的输出进行筛选,保留关键内容同时过滤掉无效的信息,提供给解码器高质量的编码结果,帮助减少生成摘要的冗余信息;通过将拷贝机制、覆盖度机制与语义相关性相融合,解决未登入词问题同时,减少重复信息的生成并提高摘要与原文的语义关联,提高摘要质量。在CNN/Daily Mail数据集上的实验结果表明,提出的模型在该数据集上能有效提高摘要ROUGE值,并且能更好地全面地概括文章内容。 陈立群 郭文忠 郭昆 郭昆关键词:文本摘要 语义相关性 选择网络